Service-Observability erkunden
Service-Observability Hilft Betriebsteams bei der Selektierung und Verwaltung von Incidents in einem komplexen und verteilten Produktionssystem. Es kombiniert die Telemetrie externer APM-Systeme (Application Performance Monitoring) mit zugehörigen Daten aus dem Configuration Management Database (CMDB) Und werden in einem einzelnen Workflow in angezeigt Service Operations-Arbeitsbereich( SOW).
Service-Observability – Übersicht
Service-Observability Zeigt Integritätsmetriken in an SOW Bezieht sich auf einen bestimmten Service. Metriken können aus einem externen APM-System erfasst und neben Informationen für zugehörige Konfigurationselemente in angezeigt werden CMDB.
Service-Observability Unterstützt die folgenden APM-Lieferanten:
- Amazon CloudWatch
- Datadog
- Dynatrace
- Microsoft Azure Überwachen
- New Relic
- SolarWinds Lokal
- Splunk Erkennbarkeit
- MySQL
- PostgreSQL (nicht unterstützt mit Splunk)
- RDS (Relational Database Service) ( Amazon CloudWatch)
Nachdem Sie eine APM-Instanz mit verbunden haben Service-Observability, Sie ordnen Services in zu CMDB Zu den APM-Metriken, die vorhandene Tags in den APM-Daten verwenden.
Mit dieser Datenzuordnung Service-Observability Kann Metriken aus APM-Entitäten anzeigen, die Ihrem Service zugeordnet sind, z. B. einem Host oder einer Datenbank, zusammen mit Informationen aus zugehörigen Konfigurationselementen (CIs). Betreiber verwenden die APM-Metriken, zugehörige CI-Informationen und hilfreiche Kontextinformationen, z. B. aktuelle Incidents und Warnungen im Zusammenhang mit dem Service, um die Integrität des Service zu verstehen.
Angenommen, Sie verwenden Dynatrace Zur Überwachung von Zur Kasse Service und Metriken aus Ihrer Datenbank und Ihrem Host verwenden das Tag Checkout-Service Um Anforderungen zu kennzeichnen, die von diesem Service stammen. Durch Zuordnung von Zur Kasse Service-CI für die APM-Daten, die mit gekennzeichnet sind Checkout-Service , Service-Observability Ruft Metriken für die Datenbanken, Hosts und CIs ab, die sich auf den Service beziehen, und zeigt sie dann zusammen an. Operatoren können Probleme bei Entitäten im Zusammenhang mit dem Service erkennen und den Minderungsprozess eingrenzen, ohne dass sie verlassen müssen SOW.
Service-Observability Anwender
| Anwender | Beschreibung |
|---|---|
| Systemadministrator |
Nur Version 1,5. Systemadministratoren konfigurieren Anwender und Teams, registrieren zu überwachende Services und stellen eine Verbindung her Service-Observability In APMs und ordnen Sie diese Services dann diesen Daten zu. Sie können die Daten auch in anzeigen SOW |
| Service-Observability-Administrator | Version 1,6.x und höher. Service-Observability Administratoren können Anwender und Teams konfigurieren und eine Verbindung herstellen Service-Observability In APMs und ordnen Sie dann Services diesen Daten zu. Sie können die Daten auch in anzeigen SOW. Administratoren können auch Dashboard-Vorlagen anpassen, die zum Anzeigen von Metriken und zugehörigen Informationen verwendet werden. |
| Operator/Vorgangsmanager Hinweis: Diese Anwender müssen zu gehören srm Gruppentyp, um alle Daten anzuzeigen. |
Operatoren verwenden Service-Observability Beim Selektieren von Incidents in SOW. Sie können grundlegende Integritätsmetriken für einen Service zusammen mit zugehörigen Incidents, Warnungen und Changes anzeigen. Sie können detailliertere Informationen erhalten, indem Sie zu navigieren Erkennbarkeit Registerkarte zum Anzeigen zusätzlicher Servicemetriken zusammen mit Metriken aus zugehörigen Entitäten, z. B. einem Host oder einer Datenbank. |
Service-Observability – Workflow
Administratoren konfigurieren Service-Observability Durch Registrierung von Services, Verbindung von APM-Metriken und anschließende Zuordnung der Services zu diesen Daten. Operatoren verwenden Service-Observability Um festzustellen, ob eine andere zugehörige Entität Probleme verursacht, die durch die Leistung des Service auftauchen.
Als Administrator:
- Bestimmen Sie die Services, die überwacht werden sollen Service-Observability Basierend auf Geschäftsrelevanz.
- Verbinden Sie vorhandene APM-Instanzen mit Service-Observability.
- Ordnen Sie Services APM-Metrikdaten basierend auf APM-basierten Tags zu, die für diese Daten verwendet werden.
- Passen Sie die Vorlagen an, die zum Anzeigen von Metrikdiagrammen verwendet werden.
Als Operator oder Manager gehen Sie wie folgt vor:
- Erkennen Sie ein Problem mit einem Service, während Sie in arbeiten SOW, Z. B. aus einer Warnung, dem Service-Dashboard oder Express-Liste, Navigieren Sie dann zur Seite „Servicedetails“.
- Zeigen Sie allgemeine Integritätsmetriken für den Service zusammen mit zugehörigen Incidents, Warnungen und Changes an. Wenn eine der Metriken fehlerhaft erscheint, navigieren Sie zur Registerkarte „Observability“.
- Zeigen Sie detailliertere Servicemetriken sowie Informationen aus zugehörigen Entitäten an, um die Ursachenuntersuchung zu starten. Wenn Sie feststellen, dass das Problem weiter unten im Stapel des Systems liegt, identifizieren Sie die Verantwortung für diese Entität, um mit der Korrektur zu beginnen.
Service-Observability – Vorteile
| Vorteil | Funktion | Anwender |
|---|---|---|
Zentralisieren Sie kritische Signale und überbrücken Sie Workflows, um die Agilität und Zuverlässigkeit zu erhöhen:
|
an. | Administratoren |
| Erhöhen Sie die Effizienz, und reduzieren Sie die durchschnittliche Zeit bis zur Lösung (Mean Time to Resolution, MTTR), indem Sie kombinierte Metriken aus Entitäten anzeigen, die einem Service zugeordnet sind. Sie können damit beginnen, den Explosionsradius und den Besitz eines Incident zu bestimmen. | Zeigen Sie Serviceintegritätsmetriken an | Operatoren |
| Sehen Sie sich zugehörige Änderungen am System und Warnungen an, die einem Service zugeordnet sind, an einem Ort an. | Zeigen Sie die allgemeine Serviceintegrität an. | Operatoren |
| Passen Sie Dashboard-Vorlagen an. | Passen Sie Dashboard-Vorlagen für Service Observability an | Administratoren |