Автоматическое многомерное построение базовых линий¶
Dynatrace AI изучает эталонные значения времени отклика, частоты ошибок и трафика приложений/сервисов.
Трафик¶
Оповещение о всплесках/падениях трафика начинается после 1 недели обучения. Dynatrace прогнозирует трафик и сравнивает с фактическим -- оповещение при статистически значимом отклонении.
Частота ошибок¶
Оповещение начинается, когда куб базовых линий готов и приложение/сервис проработали минимум 20% недели (7 дней). Для новых сервисов (< 24 часов) -- адаптированные базовые линии через короткие интервалы.
Время отклика¶
Dynatrace отслеживает медиану и 90-й перцентиль (самые медленные 10% вызовов). Особое внимание на 10% самых медленных откликов -- они выявляют проблемы, скрытые за медианой (например, запросы без кеша). Оповещение после готовности куба базовых линий и 20% недели работы.
Многомерность¶
Куб базовых линий строится по комбинациям измерений для высокой точности порогов.
Измерения приложений¶
- Пользовательское действие (login, logout и т.д.)
- Геолокация (континент > страна > регион > город)
- Браузер (семейство > версия)
- Операционная система (ОС > версия)
Измерения сервисов¶
- Метод сервиса (отдельные методы, SQL-запросы)
- Группа методов (статические/динамические, insert/update/select)
Сервисы типа PROCESS не поддерживают автоматическое построение базовых линий.
Как это работает¶
Куб базовых линий рассчитывается через 2 часа после обнаружения OneAgent, затем пересчитывается ежедневно. Пример:
USA - New York — Chrome — Response time: 2s, error rate: 0%, load: 2 actions/min
China — Beijing - QQ Browser — Response time: 4s, error rate: 1%, load: 1 actions/min
Интеллектуальное оповещение¶
Базовые линии оцениваются в скользящих окнах 5 и 15 минут. При большом количестве нарушений -- оповещение и за 1 минуту.
Нестабильные приложения/сервисы (< 20% недели работы) не оповещаются. Трафик требует 1 неделю обучения.
Новые аномалии не всегда приводят к немедленному оповещению -- сначала определяется корневая причина через контекстно-зависимый анализ зависимостей.
Тайм-ауты событий базовых линий¶
Минимальная длительность события -- 5 минут. Механизм тайм-аута объединяет минутные аномалии в одно событие. Опция Only alert if abnormal state remains for at least X minutes не применима для интервалов < 5 минут.