Kubernetes¶

Приложение Kubernetes оптимизировано для DevOps-инженеров и SRE. Мониторинг работоспособности и производительности мультиоблачных сред Kubernetes.

Метрики, события и логи хранятся в Grail с поддержкой DQL в Kubernetes, Dashboards и Workflows.

Предварительные условия¶

Среда Dynatrace на базе Grail и AppEngine.
Лицензия DPS с возможностью Мониторинг платформы Kubernetes.
Достаточные разрешения.
ActiveGate 1.327+ для улучшенной видимости объектов Kubernetes.

Недоступно для управляемых приложений и сред без Grail. Используйте Kubernetes Classic для таких случаев.

Настройка¶

Включить Kubernetes для существующих кластеров

Explorer¶

Общий интерфейс мониторинга с боковой панелью, списком объектов, фильтрами и индикаторами работоспособности.

Базовая структура¶

Боковая панель — объекты Kubernetes по типу: кластеры, узлы, пространства имён, рабочие нагрузки, поды, службы, контейнеры.
Список объектов — таблица всех объектов выбранного типа.
Полоса здоровья — совокупное состояние отображаемых объектов.
Панель фильтров — сужение представления по объектам или состояниям.

Детальный вид¶

Выберите объект для просмотра сводки состояния, метрик здоровья и использования, логов, событий, владельцев и уязвимостей.

Перспективы¶

Здоровье — оповещения и информация о состоянии.
Использование — метрики ЦП, памяти и ресурсов.

Настройка столбцов сохраняется в браузере.

Состояние здоровья Dynatrace Intelligence¶

Индикаторы работоспособности объединяют состояния пользовательских оповещений для каждого ресурса. Объект считается неработоспособным, если любое связанное оповещение в неработоспособном состоянии.

Вкладка Рекомендации показывает рекомендуемые оповещения для кластеров, узлов, пространств имён, PVC и рабочих нагрузок. Выберите Активировать или Настроить для применения.

Оповещения о состоянии и предупреждающие сигналы¶

Health alert — критические события, инициирующие расследование в Dynatrace Problems.
Warning signal — некритические предупреждения.

Типы предупреждающих сигналов: * Проблемные условия (например, DiskPressure, MemoryPressure) — в начале списка. * События-предупреждения (например, OOMKilled, PodEviction) — после условий, отсортированы по частоте.

Столбец	Примеры
Node warning signals	`DiskPressure`, `MemoryPressure`, `NodeNotReady`
Pod warning signals	`BackOff`, `PodEviction`, `OOMKilled`
Workload warning signals	`CPUThrottlingHigh`, `ContainerRestarts`, `PodsPending`

Действия: переход к затронутым узлам/рабочим нагрузкам, исследование событий, фильтрация.

Связанные ресурсы¶

Playground — тестирование в песочнице.
Видео: от 0 до полной наблюдаемости за 3 минуты