Kubernetes¶
Приложение Kubernetes оптимизировано для DevOps-инженеров и SRE. Мониторинг работоспособности и производительности мультиоблачных сред Kubernetes.
Метрики, события и логи хранятся в Grail с поддержкой DQL в Kubernetes, Dashboards и Workflows.
Предварительные условия¶
- Среда Dynatrace на базе Grail и AppEngine.
- Лицензия DPS с возможностью Мониторинг платформы Kubernetes.
- Достаточные разрешения.
- ActiveGate 1.327+ для улучшенной видимости объектов Kubernetes.
Недоступно для управляемых приложений и сред без Grail. Используйте Kubernetes Classic для таких случаев.
Настройка¶
Включить Kubernetes для существующих кластеров
Explorer¶
Общий интерфейс мониторинга с боковой панелью, списком объектов, фильтрами и индикаторами работоспособности.
Базовая структура¶
- Боковая панель — объекты Kubernetes по типу: кластеры, узлы, пространства имён, рабочие нагрузки, поды, службы, контейнеры.
- Список объектов — таблица всех объектов выбранного типа.
- Полоса здоровья — совокупное состояние отображаемых объектов.
- Панель фильтров — сужение представления по объектам или состояниям.
Детальный вид¶
Выберите объект для просмотра сводки состояния, метрик здоровья и использования, логов, событий, владельцев и уязвимостей.
Перспективы¶
- Здоровье — оповещения и информация о состоянии.
- Использование — метрики ЦП, памяти и ресурсов.
Настройка столбцов сохраняется в браузере.
Состояние здоровья Dynatrace Intelligence¶
Индикаторы работоспособности объединяют состояния пользовательских оповещений для каждого ресурса. Объект считается неработоспособным, если любое связанное оповещение в неработоспособном состоянии.
Вкладка Рекомендации показывает рекомендуемые оповещения для кластеров, узлов, пространств имён, PVC и рабочих нагрузок. Выберите Активировать или Настроить для применения.
Оповещения о состоянии и предупреждающие сигналы¶
- Health alert — критические события, инициирующие расследование в Dynatrace Problems.
- Warning signal — некритические предупреждения.
Типы предупреждающих сигналов:
* Проблемные условия (например, DiskPressure, MemoryPressure) — в начале списка.
* События-предупреждения (например, OOMKilled, PodEviction) — после условий, отсортированы по частоте.
| Столбец | Примеры |
|---|---|
| Node warning signals | DiskPressure, MemoryPressure, NodeNotReady |
| Pod warning signals | BackOff, PodEviction, OOMKilled |
| Workload warning signals | CPUThrottlingHigh, ContainerRestarts, PodsPending |
Действия: переход к затронутым узлам/рабочим нагрузкам, исследование событий, фильтрация.
Связанные ресурсы¶
- Playground — тестирование в песочнице.
- Видео: от 0 до полной наблюдаемости за 3 минуты