Перейти к содержанию

Автоматическое многомерное построение базовых линий

Dynatrace AI изучает эталонные значения времени отклика, частоты ошибок и трафика приложений/сервисов.

Трафик

Оповещение о всплесках/падениях трафика начинается после 1 недели обучения. Dynatrace прогнозирует трафик и сравнивает с фактическим -- оповещение при статистически значимом отклонении.

Частота ошибок

Оповещение начинается, когда куб базовых линий готов и приложение/сервис проработали минимум 20% недели (7 дней). Для новых сервисов (< 24 часов) -- адаптированные базовые линии через короткие интервалы.

Время отклика

Dynatrace отслеживает медиану и 90-й перцентиль (самые медленные 10% вызовов). Особое внимание на 10% самых медленных откликов -- они выявляют проблемы, скрытые за медианой (например, запросы без кеша). Оповещение после готовности куба базовых линий и 20% недели работы.

Многомерность

Куб базовых линий строится по комбинациям измерений для высокой точности порогов.

Измерения приложений

  • Пользовательское действие (login, logout и т.д.)
  • Геолокация (континент > страна > регион > город)
  • Браузер (семейство > версия)
  • Операционная система (ОС > версия)

Измерения сервисов

  • Метод сервиса (отдельные методы, SQL-запросы)
  • Группа методов (статические/динамические, insert/update/select)

Сервисы типа PROCESS не поддерживают автоматическое построение базовых линий.

Как это работает

Куб базовых линий рассчитывается через 2 часа после обнаружения OneAgent, затем пересчитывается ежедневно. Пример:

USA - New York — Chrome — Response time: 2s, error rate: 0%, load: 2 actions/min
China — Beijing - QQ Browser — Response time: 4s, error rate: 1%, load: 1 actions/min

Интеллектуальное оповещение

Базовые линии оцениваются в скользящих окнах 5 и 15 минут. При большом количестве нарушений -- оповещение и за 1 минуту.

Нестабильные приложения/сервисы (< 20% недели работы) не оповещаются. Трафик требует 1 неделю обучения.

Новые аномалии не всегда приводят к немедленному оповещению -- сначала определяется корневая причина через контекстно-зависимый анализ зависимостей.

Тайм-ауты событий базовых линий

Минимальная длительность события -- 5 минут. Механизм тайм-аута объединяет минутные аномалии в одно событие. Опция Only alert if abnormal state remains for at least X minutes не применима для интервалов < 5 минут.