Explorer Observabilité des services
Observabilité des services aide les équipes opérationnelles à trier et à gérer les incidents dans un système de production complexe et distribué. Il combine les données de télémétrie des systèmes externes de surveillance de la performance des applications (APM) avec les données connexes du Base de données de gestion des configurations (CMDB) et affiche les deux dans un seul workflow dans le Espace de travail pour l'exploitation des services (SOW).
Vue d'ensemble de Observabilité des services
Observabilité des services Affiche les mesures d’intégrité SOW liées à un service donné. Les mesures peuvent être ingérées à partir d’un système APM externe et affichées avec les informations relatives aux éléments de configuration associés dans le CMDB.
Observabilité des services prend en charge les fournisseurs APM suivants :
- Datadog
- Dynatrace
- New Relic
- MySQL
- PostgreSQL (non pris en charge avec Splunk)
- RDS (service de base de données relationnelle) (Amazon CloudWatch)
Après avoir connecté une instance APM à Observabilité des services, mappez les services dans les CMDB mesures APM à l’aide des balises existantes.
Avec ce mappage de données, affiche les mesures APM pour des entités telles que l’hôte ou la base de données, Observabilité des services ainsi que des détails sur les informations de CI connexes. Les opérateurs utilisent ces mesures et informations contextuelles, y compris les incidents et alertes actuels, pour évaluer l’intégrité du service.
Par exemple, supposons que vous utilisez Dynatrace pour surveiller votre service de paiement et que les mesures de votre base de données et de votre hôte utilisent le service de paiement de balises pour indiquer les demandes provenant de ce service. En mappant le CI du service d’extraction aux données APM balisées avec service de paiement, récupère les mesures pour ces bases de données, Observabilité des services hôtes et CI associés au service, puis les affiche ensemble. Les opérateurs peuvent identifier les problèmes sur les entités liées au service et affiner le processus d’atténuation sans avoir à quitter le SOW.
Observabilité des services utilisateurs
| Utilisateur | Description |
|---|---|
| Administrateur système |
Version 1.5 uniquement. Les administrateurs système configurent les utilisateurs et les équipes, enregistrent les services à surveiller, se connectent Observabilité des services aux APM, puis mappent ces services à ces données. Ils peuvent également afficher les données dans le SOW |
| Observabilité des services administrateur | Version 1.6.x et ultérieure. Observabilité des services Les administrateurs peuvent configurer les utilisateurs et les équipes, se connecter Observabilité des services aux APM, puis mapper les services à ces données. Ils peuvent également afficher les données dans le SOW. Les administrateurs peuvent également personnaliser les modèles de tableau de bord utilisés pour afficher des mesures et des informations connexes. |
| Opérateur/responsable des opérations Remarque : Ces utilisateurs doivent appartenir à un type de groupe SRM pour voir toutes les données. |
Opérateurs utilisés Observabilité des services lors du triage des incidents dans le SOW. Ils peuvent afficher les mesures d’intégrité de base d’un service, ainsi que les incidents, alertes et changements associés. Ils peuvent obtenir des informations plus détaillées en naviguant vers l’onglet Observabilité pour afficher des mesures de service supplémentaires, ainsi que des mesures provenant d’entités connexes, telles qu’un hôte ou une base de données. |
Workflow Observabilité des services
Pour ce faire, les administrateurs effectuent la configuration Observabilité des services en enregistrant les services, en connectant les mesures APM, puis en mappant les services à ces données. Les opérateurs l’utilisent Observabilité des services pour déterminer si une autre entité connexe est à l’origine de problèmes liés aux performances du service.
En tant qu’administrateur, vous devez :
- Déterminez les services à surveiller en Observabilité des services fonction de la criticité opérationnelle.
- Connectez les instances APM existantes à Observabilité des services.
- Mappez les services avec des données de mesures APM basées sur les balises APM utilisées sur ces données.
- Personnalisez les modèles utilisés pour afficher les graphiques de mesures.
En tant qu’opérateur ou gestionnaire, vous :
- Repérez un problème avec un service lors de l’utilisation dans , par exemple à partir d’une SOW alerte, du tableau de bord de service ou Liste express, puis accédez à la page Détails du service.
- Affichez les mesures d’intégrité globales du service, ainsi que les incidents, alertes et changements associés. Si l’une des mesures semble défectueuse, accédez à l’onglet Observabilité.
- Affichez des mesures de service plus détaillées, ainsi que des informations provenant d’entités connexes, pour commencer une enquête sur la cause première. Lorsque vous constatez que le problème se trouve plus bas dans la pile du système, identifiez la propriété de cette entité pour commencer le rattrapage.
Observabilité des services avantages
| Avantage | Fonctionnalité | Utilisateurs |
|---|---|---|
Centralisez les signaux critiques et reliez les flux de travail pour accroître l’agilité et la fiabilité :
|
. | Administrateurs |
| Augmentez l’efficacité et réduisez le délai moyen de résolution (MTTR). Affichez les mesures combinées des entités associées à un service pour commencer à déterminer le rayon de l’explosion et la propriété d’un incident. | Afficher les mesures d’intégrité du service | Opérateurs |
| Consultez les changements connexes apportés au système et les alertes associées à un service en un seul endroit. | Afficher l’intégrité globale du service. | Opérateurs |
| Personnalisez les modèles de tableau de bord. | Personnaliser les modèles de tableau de bord d’Observabilité des services | Administrateurs |