Анализ и корреляция событий¶
События представляют единичные аномалии (нарушение порога, деградация, сбои процессов) и информационные изменения (развёртывания, конфигурации). Вместе с логами, метриками и трассировками формируют входные данные для анализа первопричин.
Корреляция событий¶
Автоматический анализ потока событий из тысяч источников (OneAgent, внешние инструменты, облачные платформы, интеграции Hub). Цель -- извлечение проблем и формирование практических выводов.
Обработка событий¶
Многоэтапный процесс: события -> проблемы с первопричиной и влиянием.
Приём¶
Источники: OneAgent, встроенные интеграции, API приёма, OpenPipeline.
Нормализация¶
Преобразование в единый семантический формат. Проверка: корректность времени, допустимость типа, уникальность свойств. Сопоставление со Semantic Dictionary и топологией Smartscape.
Построение топологии¶
Топология Smartscape -- представление всех каузальных взаимосвязей в реальном времени. Создаётся автоматически из метрик, событий, логов, трассировок. Поддерживается пользовательское извлечение топологии из принятых данных.
Агрегация¶
Консолидация данных из разных источников на единой странице сущности с динамическим отображением связанных сущностей.
Дедупликация¶
Группировка событий в единую проблему. Три уровня:
По источнику -- одинаковый тип + один источник. Пример: 3 инструмента сообщают о CPU saturation на Server-23 -> одна проблема.
Во времени -- одинаковый тип + один источник + разное время начала. Окно наблюдения "3 из 5 минут" предотвращает шум при колебаниях.
По каузальной топологии -- события из одного каузального графа Smartscape (вертикальный стек + горизонтальные вызовы). Пример: фронтенд + 3 связанных сервиса с замедлением -> одна проблема.
Пользовательская корреляция¶
Управляющие свойства для принимаемых событий: dt.event.allow_davis_merge -- разрешение/запрет объединения в проблему. Дополнительно: поле event.davis из Semantic Dictionary.
Анализ первопричин¶
Каузальный ИИ обходит топологию, оценивает события и серьёзности, запускает обнаружение точек изменения метрик. Точки изменения подтверждают/отклоняют метрические события и обнаруживают неизвестные аномалии без активного оповещения.
Алгоритм ранжирования определяет сущность с наивысшим рангом как первопричину.
В последней версии Dynatrace все обнаруженные точки изменения принимаются в Grail как события Davis, что может увеличить число затронутых сущностей по сравнению с предыдущей версией.
Влияние на бизнес¶
Обход каузального графа в обратном направлении для нахождения затронутых точек входа (приложения, сервисы). Показывает: затронутых пользователей, количество трассировок, статистическую оценку влияния на конечные точки.