Перейти к содержанию

Хосты и операции

Приложение Infrastructure & Operations упрощает мониторинг инфраструктуры и анализ первопричин проблем.

  • Индикаторы состояния на базе Dynatrace Intelligence для раннего обнаружения деградации.
  • Метрики, логи и события для всех объектов инфраструктуры.
  • Переход к деталям любого объекта инфраструктуры.

Предварительные требования

  1. Разверните OneAgent на хостах.
  2. Для облачных сервисов — интегрируйте облачную инфраструктуру с Dynatrace (AWS, Azure, GCP и др.).

Разрешения

Разрешение Описание
storage:logs:read Запрос логов из Grail
storage:events:read Запрос событий из Grail
storage:buckets:read Чтение бакетов
storage:metrics:read Запрос метрик из Grail
storage:entities:read Запрос сущностей из Grail
storage:fieldsets:read Чтение маскированных/конфиденциальных полей
state:user-app-states:read Чтение состояния пользователя
state:user-app-states:write Запись состояния пользователя
settings:objects:read Чтение настроек из Settings 2.0
settings:objects:write Запись настроек в Settings 2.0

Начало работы

Приложение предоставляет актуальное представление отслеживаемых сред для быстрого обнаружения проблем и детального анализа первопричин.

Навигация

Данные дата-центров, хостов и сетевых устройств отображаются в виде списков. Сортировка по столбцам, настройка видимых столбцов через Настройки столбцов.

Доступ к деталям объектов

  1. Перейдите в Infrastructure & Operations и выберите Hosts, Containers, Processes или Network devices.
  2. Выберите объект из списка.

Фильтрация

Используйте поле фильтра с автодополнением. Поддерживается добавление нескольких условий, например: "Alert status" = Critical name != *1b*.

Сегменты

Сегменты позволяют логически структурировать данные наблюдаемости. Они гибкие, простые в использовании и могут быть общими для пользователей.

Применение: Infrastructure & Operations > Segments > выберите сегмент > Apply.

Добавление: Infrastructure & Operations > Segments > Manage segments > Segment > задайте имя, фильтры > Save.

Анализ графиков

Выберите меню в углу графика для настройки отображаемых метрик.

Экспорт в Notebooks: выберите объект > график > Open in Notebooks.

Просмотр процессов хоста

Вкладка Processes в представлении хоста показывает графики CPU/Memory с топ-5 потребителями.

Мониторинг соединений

Раздел Connections в представлении хоста показывает входящие/исходящие соединения с количеством проблем. Помогает выявить внешние источники проблем.

Доступность хоста (Reachability)

Столбец Reachability показывает отношение полностью доступных NAM-мониторов ко всем настроенным. Требуется настройка NAM.

Оповещения о состоянии и предупреждающие сигналы

  • Health alert — критические события, инициирующие расследование в Dynatrace Problems.
  • Warning signal — некритические предупреждения о потенциальной проблеме.

Для включения: Settings > Analyze and alert > Alerts > Category update > включите Updated classification for select ready-made alerts.

После включения следующие оповещения преобразуются в предупреждения:

Тип объекта Тип события Описание
HOST OSI_HIGH_CPU Использование ЦП
HOST OSI_NIC_DROPPED_PACKETS_HIGH Высокий уровень потерянных пакетов
HOST RESOURCE_CONTENTION Медленный диск
PGI PROCESS_RESTART Перезапуск процесса

Технологии

Вкладка Technologies отображает установленные расширения по категориям.

Минимальные версии расширений для сетевых устройств:

Расширение Минимальная версия
SNMP Autodiscovery 2.2.8
Generic Cisco Device 2.1.4
F5 BIG-IP 2.10.0
Palo Alto firewalls 2.7.0
Juniper Networks (SNMP) 1.5.0
Generic network device 2.0.0
Fortigate 1.2.21

Концепции

Основные компоненты:

Взаимосвязь хостов, контейнеров и процессов

  • Хосты — вкладки Processes и Containers для перехода к связанным объектам.
  • Контейнеры — работают на хостах. Вкладка Overview содержит ссылки на хост и группу контейнеров. Вкладка Processes — связанные процессы.
  • Процессы — выполняются на хостах или в контейнерах. Метаданные содержат ссылки на хост, группу процессов и контейнер.

Сценарии использования

  • Оценка состояния дата-центров, хостов и сетевых устройств.
  • Определение первопричин проблем инфраструктуры.
  • Оптимизация производительности инфраструктуры.
  • Оценка сетевой доступности через интеграцию с NAM.