Перейти к содержанию

Мониторинг AWS Step Functions

  • 5 минут чтения

Dynatrace получает метрики для нескольких предустановленных пространств имён, включая AWS Step Functions. Вы можете просматривать метрики для каждого экземпляра сервиса, разделять метрики по нескольким измерениям и создавать пользовательские графики, которые можно закрепить на дашбордах.

Предварительные требования

Для включения мониторинга этого сервиса необходимо

  • ActiveGate версии 1.197+

  • Для развёртываний Dynatrace требуется Environment ActiveGate или Multi-environment ActiveGate.

Для доступа на основе ролей в развёртывании Dynatrace необходим Environment ActiveGate, установленный на хосте Amazon EC2.

Чтобы обновить политику AWS IAM, используйте приведённый ниже JSON, содержащий политику мониторинга (разрешения) для всех поддерживаемых сервисов.

Предустановленная политика JSON для всех поддерживаемых сервисов

{


"Version": "2012-10-17",


"Statement": [


{


"Sid": "VisualEditor0",


"Effect": "Allow",


"Action": [


"acm-pca:ListCertificateAuthorities",


"apigateway:GET",


"apprunner:ListServices",


"appstream:DescribeFleets",


"appsync:ListGraphqlApis",


"athena:ListWorkGroups",


"autoscaling:DescribeAutoScalingGroups",


"cloudformation:ListStackResources",


"cloudfront:ListDistributions",


"cloudhsm:DescribeClusters",


"cloudsearch:DescribeDomains",


"cloudwatch:GetMetricData",


"cloudwatch:GetMetricStatistics",


"cloudwatch:ListMetrics",


"codebuild:ListProjects",


"datasync:ListTasks",


"dax:DescribeClusters",


"directconnect:DescribeConnections",


"dms:DescribeReplicationInstances",


"dynamodb:ListTables",


"dynamodb:ListTagsOfResource",


"ec2:DescribeAvailabilityZones",


"ec2:DescribeInstances",


"ec2:DescribeNatGateways",


"ec2:DescribeSpotFleetRequests",


"ec2:DescribeTransitGateways",


"ec2:DescribeVolumes",


"ec2:DescribeVpnConnections",


"ecs:ListClusters",


"eks:ListClusters",


"elasticache:DescribeCacheClusters",


"elasticbeanstalk:DescribeEnvironmentResources",


"elasticbeanstalk:DescribeEnvironments",


"elasticfilesystem:DescribeFileSystems",


"elasticloadbalancing:DescribeInstanceHealth",


"elasticloadbalancing:DescribeListeners",


"elasticloadbalancing:DescribeLoadBalancers",


"elasticloadbalancing:DescribeRules",


"elasticloadbalancing:DescribeTags",


"elasticloadbalancing:DescribeTargetHealth",


"elasticmapreduce:ListClusters",


"elastictranscoder:ListPipelines",


"es:ListDomainNames",


"events:ListEventBuses",


"firehose:ListDeliveryStreams",


"fsx:DescribeFileSystems",


"gamelift:ListFleets",


"glue:GetJobs",


"inspector:ListAssessmentTemplates",


"kafka:ListClusters",


"kinesis:ListStreams",


"kinesisanalytics:ListApplications",


"kinesisvideo:ListStreams",


"lambda:ListFunctions",


"lambda:ListTags",


"lex:GetBots",


"logs:DescribeLogGroups",


"mediaconnect:ListFlows",


"mediaconvert:DescribeEndpoints",


"mediapackage-vod:ListPackagingConfigurations",


"mediapackage:ListChannels",


"mediatailor:ListPlaybackConfigurations",


"opsworks:DescribeStacks",


"qldb:ListLedgers",


"rds:DescribeDBClusters",


"rds:DescribeDBInstances",


"rds:DescribeEvents",


"rds:ListTagsForResource",


"redshift:DescribeClusters",


"robomaker:ListSimulationJobs",


"route53:ListHostedZones",


"route53resolver:ListResolverEndpoints",


"s3:ListAllMyBuckets",


"sagemaker:ListEndpoints",


"sns:ListTopics",


"sqs:ListQueues",


"storagegateway:ListGateways",


"sts:GetCallerIdentity",


"swf:ListDomains",


"tag:GetResources",


"tag:GetTagKeys",


"transfer:ListServers",


"workmail:ListOrganizations",


"workspaces:DescribeWorkspaces"


],


"Resource": "*"


}


]


}

Если вы не хотите добавлять разрешения для всех сервисов, а хотите выбрать разрешения только для определённых сервисов, обратитесь к таблице ниже. Таблица содержит набор разрешений, необходимых для всех облачных сервисов AWS, а также для каждого поддерживаемого сервиса — список дополнительных разрешений, специфичных для этого сервиса.

Разрешения, необходимые для интеграции мониторинга AWS:

  • "cloudwatch:GetMetricData"
  • "cloudwatch:GetMetricStatistics"
  • "cloudwatch:ListMetrics"
  • "sts:GetCallerIdentity"
  • "tag:GetResources"
  • "tag:GetTagKeys"
  • "ec2:DescribeAvailabilityZones"

Полный список разрешений для облачных сервисов

Название Разрешения
Все отслеживаемые сервисы Amazon Обязательно cloudwatch:GetMetricData, cloudwatch:GetMetricStatistics, cloudwatch:ListMetrics, sts:GetCallerIdentity, tag:GetResources, tag:GetTagKeys, ec2:DescribeAvailabilityZones
AWS Certificate Manager Private Certificate Authority acm-pca:ListCertificateAuthorities
Amazon MQ
Amazon API Gateway apigateway:GET
AWS App Runner apprunner:ListServices
Amazon AppStream appstream:DescribeFleets
AWS AppSync appsync:ListGraphqlApis
Amazon Athena athena:ListWorkGroups
Amazon Aurora rds:DescribeDBClusters
Amazon EC2 Auto Scaling autoscaling:DescribeAutoScalingGroups
Amazon EC2 Auto Scaling (встроенный) autoscaling:DescribeAutoScalingGroups
AWS Billing
Amazon Keyspaces
AWS Chatbot
Amazon CloudFront cloudfront:ListDistributions
AWS CloudHSM cloudhsm:DescribeClusters
Amazon CloudSearch cloudsearch:DescribeDomains
AWS CodeBuild codebuild:ListProjects
Amazon Cognito
Amazon Connect
Amazon Elastic Kubernetes Service (EKS) eks:ListClusters
AWS DataSync datasync:ListTasks
Amazon DynamoDB Accelerator (DAX) dax:DescribeClusters
AWS Database Migration Service (AWS DMS) dms:DescribeReplicationInstances
Amazon DocumentDB rds:DescribeDBClusters
AWS Direct Connect directconnect:DescribeConnections
Amazon DynamoDB dynamodb:ListTables
Amazon DynamoDB (встроенный) dynamodb:ListTables, dynamodb:ListTagsOfResource
Amazon EBS ec2:DescribeVolumes
Amazon EBS (встроенный) ec2:DescribeVolumes
Amazon EC2 API
Amazon EC2 (встроенный) ec2:DescribeInstances
Amazon EC2 Spot Fleet ec2:DescribeSpotFleetRequests
Amazon Elastic Container Service (ECS) ecs:ListClusters
Amazon ECS Container Insights ecs:ListClusters
Amazon ElastiCache (EC) elasticache:DescribeCacheClusters
AWS Elastic Beanstalk elasticbeanstalk:DescribeEnvironments
Amazon Elastic File System (EFS) elasticfilesystem:DescribeFileSystems
Amazon Elastic Inference
Amazon Elastic Map Reduce (EMR) elasticmapreduce:ListClusters
Amazon Elasticsearch Service (ES) es:ListDomainNames
Amazon Elastic Transcoder elastictranscoder:ListPipelines
Amazon Elastic Load Balancer (ELB) (встроенный) elasticloadbalancing:DescribeInstanceHealth, elasticloadbalancing:DescribeListeners, elasticloadbalancing:DescribeLoadBalancers, elasticloadbalancing:DescribeRules, elasticloadbalancing:DescribeTags, elasticloadbalancing:DescribeTargetHealth
Amazon EventBridge events:ListEventBuses
Amazon FSx fsx:DescribeFileSystems
Amazon GameLift gamelift:ListFleets
AWS Glue glue:GetJobs
Amazon Inspector inspector:ListAssessmentTemplates
AWS Internet of Things (IoT)
AWS IoT Analytics
Amazon Managed Streaming for Kafka kafka:ListClusters
Amazon Kinesis Data Analytics kinesisanalytics:ListApplications
Amazon Data Firehose firehose:ListDeliveryStreams
Amazon Kinesis Data Streams kinesis:ListStreams
Amazon Kinesis Video Streams kinesisvideo:ListStreams
AWS Lambda lambda:ListFunctions
AWS Lambda (встроенный) lambda:ListFunctions, lambda:ListTags
Amazon Lex lex:GetBots
Amazon Application and Network Load Balancer (встроенный) elasticloadbalancing:DescribeInstanceHealth, elasticloadbalancing:DescribeListeners, elasticloadbalancing:DescribeLoadBalancers, elasticloadbalancing:DescribeRules, elasticloadbalancing:DescribeTags, elasticloadbalancing:DescribeTargetHealth
Amazon CloudWatch Logs logs:DescribeLogGroups
AWS Elemental MediaConnect mediaconnect:ListFlows
AWS Elemental MediaConvert mediaconvert:DescribeEndpoints
AWS Elemental MediaPackage Live mediapackage:ListChannels
AWS Elemental MediaPackage Video on Demand mediapackage-vod:ListPackagingConfigurations
AWS Elemental MediaTailor mediatailor:ListPlaybackConfigurations
Amazon VPC NAT Gateways ec2:DescribeNatGateways
Amazon Neptune rds:DescribeDBClusters
AWS OpsWorks opsworks:DescribeStacks
Amazon Polly
Amazon QLDB qldb:ListLedgers
Amazon RDS rds:DescribeDBInstances
Amazon RDS (встроенный) rds:DescribeDBInstances, rds:DescribeEvents, rds:ListTagsForResource
Amazon Redshift redshift:DescribeClusters
Amazon Rekognition
AWS RoboMaker robomaker:ListSimulationJobs
Amazon Route 53 route53:ListHostedZones
Amazon Route 53 Resolver route53resolver:ListResolverEndpoints
Amazon S3 s3:ListAllMyBuckets
Amazon S3 (встроенный) s3:ListAllMyBuckets
Amazon SageMaker Batch Transform Jobs
Amazon SageMaker Endpoint Instances sagemaker:ListEndpoints
Amazon SageMaker Endpoints sagemaker:ListEndpoints
Amazon SageMaker Ground Truth
Amazon SageMaker Processing Jobs
Amazon SageMaker Training Jobs
AWS Service Catalog
Amazon Simple Email Service (SES)
Amazon Simple Notification Service (SNS) sns:ListTopics
Amazon Simple Queue Service (SQS) sqs:ListQueues
AWS Systems Manager - Run Command
AWS Step Functions
AWS Storage Gateway storagegateway:ListGateways
Amazon SWF swf:ListDomains
Amazon Textract
AWS IoT Things Graph
AWS Transfer Family transfer:ListServers
AWS Transit Gateway ec2:DescribeTransitGateways
Amazon Translate
AWS Trusted Advisor
AWS API Usage
AWS Site-to-Site VPN ec2:DescribeVpnConnections
AWS WAF Classic
AWS WAF
Amazon WorkMail workmail:ListOrganizations
Amazon WorkSpaces workspaces:DescribeWorkspaces

Пример политики JSON для одного отдельного сервиса.

Политика JSON для Amazon API Gateway

{


"Version": "2012-10-17",


"Statement": [


{


"Sid": "VisualEditor0",


"Effect": "Allow",


"Action": [


"apigateway:GET",


"cloudwatch:GetMetricData",


"cloudwatch:GetMetricStatistics",


"cloudwatch:ListMetrics",


"sts:GetCallerIdentity",


"tag:GetResources",


"tag:GetTagKeys",


"ec2:DescribeAvailabilityZones"


],


"Resource": "*"


}


]


}

В этом примере из полного списка разрешений необходимо выбрать

  • "apigateway:GET" для Amazon API Gateway
  • "cloudwatch:GetMetricData", "cloudwatch:GetMetricStatistics", "cloudwatch:ListMetrics", "sts:GetCallerIdentity", "tag:GetResources", "tag:GetTagKeys" и "ec2:DescribeAvailabilityZones" для всех облачных сервисов AWS.

Включение мониторинга

Чтобы узнать, как включить мониторинг сервиса, см. Включение мониторинга сервиса.

Просмотр метрик сервиса

Метрики сервиса можно просматривать в среде Dynatrace на странице обзора пользовательского устройства или на странице Дашборды.

Просмотр метрик на странице обзора пользовательского устройства

Для доступа к странице обзора пользовательского устройства

  1. Перейдите в раздел Technologies Технологии и процессы Classic.
  2. Отфильтруйте по имени сервиса и выберите нужную группу пользовательских устройств.
  3. После выбора группы пользовательских устройств вы перейдёте на страницу обзора группы пользовательских устройств.
  4. На странице обзора группы пользовательских устройств перечислены все экземпляры (пользовательские устройства), принадлежащие группе. Выберите экземпляр, чтобы перейти на страницу обзора пользовательского устройства.

Просмотр метрик на дашборде

После добавления сервиса в мониторинг предустановленный дашборд, содержащий все рекомендуемые метрики, автоматически появится на странице Дашборды. Для поиска конкретных дашбордов используйте фильтр по Preset, затем по Name.

AWS presets

Для уже отслеживаемых сервисов может потребоваться повторно сохранить учётные данные, чтобы предустановленный дашборд появился на странице Дашборды. Чтобы повторно сохранить учётные данные, перейдите в Settings > Cloud and virtualization > AWS, выберите нужный экземпляр AWS и нажмите Save.

Вы не можете вносить изменения непосредственно в предустановленный дашборд, но можете его клонировать и редактировать. Чтобы клонировать дашборд, откройте контекстное меню () и выберите Clone.

Чтобы убрать дашборд со страницы дашбордов, его можно скрыть. Чтобы скрыть дашборд, откройте контекстное меню () и выберите Hide.

Скрытие дашборда не влияет на других пользователей.

Clone hide AWS

Чтобы проверить доступность предустановленных дашбордов для каждого сервиса AWS, см. список ниже.

Список доступности предустановленных дашбордов

Сервис AWS Предустановленный дашборд
Amazon EC2 Auto Scaling (встроенный) Не применяется
AWS Lambda (встроенный) Не применяется
Amazon Application and Network Load Balancer (встроенный) Не применяется
Amazon DynamoDB (встроенный) Не применяется
Amazon EBS (встроенный) Не применяется
Amazon EC2 (встроенный) Не применяется
Amazon Elastic Load Balancer (ELB) (встроенный) Не применяется
Amazon RDS (встроенный) Не применяется
Amazon S3 (встроенный) Не применяется
AWS Certificate Manager Private Certificate Authority Не применяется
Все отслеживаемые сервисы Amazon Не применяется
Amazon API Gateway Не применяется
AWS App Runner Не применяется
Amazon AppStream Применяется
AWS AppSync Применяется
Amazon Athena Применяется
Amazon Aurora Не применяется
Amazon EC2 Auto Scaling Применяется
AWS Billing Применяется
Amazon Keyspaces Применяется
AWS Chatbot Применяется
Amazon CloudFront Не применяется
AWS CloudHSM Применяется
Amazon CloudSearch Применяется
AWS CodeBuild Применяется
Amazon Cognito Не применяется
Amazon Connect Применяется
AWS DataSync Применяется
Amazon DynamoDB Accelerator (DAX) Применяется
AWS Database Migration Service (AWS DMS) Применяется
Amazon DocumentDB Применяется
AWS Direct Connect Применяется
Amazon DynamoDB Не применяется
Amazon EBS Не применяется
Amazon EC2 Spot Fleet Не применяется
Amazon EC2 API Применяется
Amazon Elastic Container Service (ECS) Не применяется
Amazon ECS Container Insights Применяется
Amazon Elastic File System (EFS) Не применяется
Amazon Elastic Kubernetes Service (EKS) Применяется
Amazon ElastiCache (EC) Не применяется
AWS Elastic Beanstalk Применяется
Amazon Elastic Inference Применяется
Amazon Elastic Transcoder Применяется
Amazon Elastic Map Reduce (EMR) Не применяется
Amazon Elasticsearch Service (ES) Не применяется
Amazon EventBridge Применяется
Amazon FSx Применяется
Amazon GameLift Применяется
AWS Glue Не применяется
Amazon Inspector Применяется
AWS Internet of Things (IoT) Не применяется
AWS IoT Things Graph Применяется
AWS IoT Analytics Применяется
Amazon Managed Streaming for Kafka Применяется
Amazon Kinesis Data Analytics Не применяется
Amazon Data Firehose Не применяется
Amazon Kinesis Data Streams Не применяется
Amazon Kinesis Video Streams Не применяется
AWS Lambda Не применяется
Amazon Lex Применяется
Amazon CloudWatch Logs Применяется
AWS Elemental MediaTailor Применяется
AWS Elemental MediaConnect Применяется
AWS Elemental MediaConvert Применяется
AWS Elemental MediaPackage Live Применяется
AWS Elemental MediaPackage Video on Demand Применяется
Amazon MQ Применяется
Amazon VPC NAT Gateways Не применяется
Amazon Neptune Применяется
AWS OpsWorks Применяется
Amazon Polly Применяется
Amazon QLDB Применяется
Amazon RDS Не применяется
Amazon Redshift Не применяется
Amazon Rekognition Применяется
AWS RoboMaker Применяется
Amazon Route 53 Применяется
Amazon Route 53 Resolver Применяется
Amazon S3 Не применяется
Amazon SageMaker Batch Transform Jobs Не применяется
Amazon SageMaker Endpoints Не применяется
Amazon SageMaker Endpoint Instances Не применяется
Amazon SageMaker Ground Truth Не применяется
Amazon SageMaker Processing Jobs Не применяется
Amazon SageMaker Training Jobs Не применяется
AWS Service Catalog Применяется
Amazon Simple Email Service (SES) Не применяется
Amazon Simple Notification Service (SNS) Не применяется
Amazon Simple Queue Service (SQS) Не применяется
AWS Systems Manager - Run Command Применяется
AWS Step Functions Применяется
AWS Storage Gateway Применяется
Amazon SWF Применяется
Amazon Textract Применяется
AWS Transfer Family Применяется
AWS Transit Gateway Применяется
Amazon Translate Применяется
AWS Trusted Advisor Применяется
AWS API Usage Применяется
AWS Site-to-Site VPN Применяется
AWS WAF Classic Применяется
AWS WAF Применяется
Amazon WorkMail Применяется
Amazon WorkSpaces Применяется

Step

Доступные метрики

Название Описание Единица Статистика Измерения Рекомендуется
ActivitiesFailed Количество неудачных операций Count Sum Region, ActivityArn Применяется
ActivitiesHeartbeatTimedOut Количество операций, завершившихся по истечении времени ожидания heartbeat Count Sum Region, ActivityArn Применяется
ActivitiesScheduled Количество запланированных операций Count Sum Region, ActivityArn Применяется
ActivitiesStarted Количество запущенных операций Count Sum Region, ActivityArn
ActivitiesSucceeded Количество успешно завершённых операций Count Sum Region, ActivityArn Применяется
ActivitiesTimedOut Количество операций, завершившихся по истечении времени при закрытии Count Sum Region, ActivityArn Применяется
ActivityRunTime Интервал в миллисекундах между временем запуска операции и временем её завершения Milliseconds Multi Region, ActivityArn Применяется
ActivityScheduleTime Интервал в миллисекундах, в течение которого операция находится в состоянии ожидания выполнения Milliseconds Multi Region, ActivityArn
ActivityTime Интервал в миллисекундах между временем планирования операции и временем её завершения Milliseconds Multi Region, ActivityArn
ConsumedCapacity Количество запросов в секунду Count Sum Region, ServiceMetric Применяется
ConsumedCapacity Count Sum Region, APIName Применяется
ExecutionThrottled Количество событий StateEntered и повторных попыток, которые были ограничены Count Sum Region, StateMachineArn Применяется
ExecutionTime Интервал в миллисекундах между временем начала выполнения и временем его завершения Milliseconds Multi Region, StateMachineArn Применяется
ExecutionsAborted Количество прерванных или завершённых выполнений Count Sum Region, StateMachineArn Применяется
ExecutionsFailed Количество неудачных выполнений Count Sum Region, StateMachineArn Применяется
ExecutionsStarted Количество запущенных выполнений Count Sum Region, StateMachineArn Применяется
ExecutionsSucceeded Количество успешно завершённых выполнений Count Sum Region, StateMachineArn Применяется
ExecutionsTimedOut Количество выполнений, завершившихся по истечении времени по любой причине Count Sum Region, StateMachineArn Применяется
LambdaFunctionRunTime Интервал в миллисекундах между временем запуска функции Lambda и временем её завершения Milliseconds Multi Region, LambdaFunctionArn Применяется
LambdaFunctionScheduleTime Интервал в миллисекундах, в течение которого функция Lambda находится в состоянии ожидания выполнения Milliseconds Multi Region, LambdaFunctionArn
LambdaFunctionTime Интервал в миллисекундах между временем планирования функции Lambda и временем её завершения Milliseconds Multi Region, LambdaFunctionArn
LambdaFunctionsFailed Количество неудачных функций Lambda Count Sum Region, LambdaFunctionArn Применяется
LambdaFunctionsScheduled Количество запланированных функций Lambda Count Sum Region, LambdaFunctionArn Применяется
LambdaFunctionsStarted Количество запущенных функций Lambda Count Sum Region, LambdaFunctionArn
LambdaFunctionsSucceeded Количество успешно завершённых функций Lambda Count Sum Region, LambdaFunctionArn Применяется
LambdaFunctionsTimedOut Количество функций Lambda, завершившихся по истечении времени при закрытии Count Sum Region, LambdaFunctionArn Применяется
ProvisionedBucketSize Количество доступных запросов в секунду Count Multi Region, ServiceMetric
ProvisionedBucketSize Count Multi Region, APIName
ProvisionedRefillRate Количество запросов в секунду, допускаемых в корзину Count Multi Region, ServiceMetric
ProvisionedRefillRate Count Multi Region, APIName
ServiceIntegrationRunTime Интервал в миллисекундах между временем запуска сервисной задачи и временем её завершения Milliseconds Multi Region, ServiceIntegrationResourceArn Применяется
ServiceIntegrationScheduleTime Интервал в миллисекундах, в течение которого сервисная задача находится в состоянии ожидания выполнения Milliseconds Multi Region, ServiceIntegrationResourceArn
ServiceIntegrationTime Интервал в миллисекундах между временем планирования сервисной задачи и временем её завершения Milliseconds Multi Region, ServiceIntegrationResourceArn
ServiceIntegrationsFailed Количество неудачных сервисных задач Count Sum Region, ServiceIntegrationResourceArn Применяется
ServiceIntegrationsScheduled Количество запланированных сервисных задач. Count Sum Region, ServiceIntegrationResourceArn Применяется
ServiceIntegrationsStarted Количество запущенных сервисных задач Count Sum Region, ServiceIntegrationResourceArn
ServiceIntegrationsSucceeded Количество успешно завершённых сервисных задач Count Sum Region, ServiceIntegrationResourceArn Применяется
ServiceIntegrationsTimedOut Количество сервисных задач, завершившихся по истечении времени при закрытии Count Sum Region, ServiceIntegrationResourceArn Применяется
ThrottledEvents Количество ограниченных запросов Count Sum Region, ServiceMetric Применяется
ThrottledEvents Count Sum Region, APIName Применяется

Ограничения

Dynatrace собирает метрики для AWS Step Functions на уровне группы пользовательских устройств, а не на уровне отдельного пользовательского устройства (метрики являются общесервисными).