Перейти к содержанию

Анализ и корреляция событий

События представляют единичные аномалии (нарушение порога, деградация, сбои процессов) и информационные изменения (развёртывания, конфигурации). Вместе с логами, метриками и трассировками формируют входные данные для анализа первопричин.

Корреляция событий

Автоматический анализ потока событий из тысяч источников (OneAgent, внешние инструменты, облачные платформы, интеграции Hub). Цель -- извлечение проблем и формирование практических выводов.

Обработка событий

Многоэтапный процесс: события -> проблемы с первопричиной и влиянием.

Приём

Источники: OneAgent, встроенные интеграции, API приёма, OpenPipeline.

Нормализация

Преобразование в единый семантический формат. Проверка: корректность времени, допустимость типа, уникальность свойств. Сопоставление со Semantic Dictionary и топологией Smartscape.

Построение топологии

Топология Smartscape -- представление всех каузальных взаимосвязей в реальном времени. Создаётся автоматически из метрик, событий, логов, трассировок. Поддерживается пользовательское извлечение топологии из принятых данных.

Агрегация

Консолидация данных из разных источников на единой странице сущности с динамическим отображением связанных сущностей.

Дедупликация

Группировка событий в единую проблему. Три уровня:

По источнику -- одинаковый тип + один источник. Пример: 3 инструмента сообщают о CPU saturation на Server-23 -> одна проблема.

Во времени -- одинаковый тип + один источник + разное время начала. Окно наблюдения "3 из 5 минут" предотвращает шум при колебаниях.

По каузальной топологии -- события из одного каузального графа Smartscape (вертикальный стек + горизонтальные вызовы). Пример: фронтенд + 3 связанных сервиса с замедлением -> одна проблема.

Пользовательская корреляция

Управляющие свойства для принимаемых событий: dt.event.allow_davis_merge -- разрешение/запрет объединения в проблему. Дополнительно: поле event.davis из Semantic Dictionary.

Анализ первопричин

Каузальный ИИ обходит топологию, оценивает события и серьёзности, запускает обнаружение точек изменения метрик. Точки изменения подтверждают/отклоняют метрические события и обнаруживают неизвестные аномалии без активного оповещения.

Алгоритм ранжирования определяет сущность с наивысшим рангом как первопричину.

В последней версии Dynatrace все обнаруженные точки изменения принимаются в Grail как события Davis, что может увеличить число затронутых сущностей по сравнению с предыдущей версией.

Влияние на бизнес

Обход каузального графа в обратном направлении для нахождения затронутых точек входа (приложения, сервисы). Показывает: затронутых пользователей, количество трассировок, статистическую оценку влияния на конечные точки.