Visualisierungen im Dashboard „Service Reliability“

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 3 Minuten Lesedauer
  • Liste der Visualisierungen und Optionen im Dashboard „Service Reliability“ in Service Reliability Management( SRM).

    Servicestatus-Diagramme

    Diagramme der obersten Ebene zeigen die Anzahl der Services in den status „Kritisch“, „gefährdet“ und „stabil“ an. Ihre status basieren auf dem Fehlerbudget, das für ihre Servicelevel-Ziele (Service Level Objectives, SLOs) verbleibt. Sie können die Diagramme auswählen, um Servicenamen anzuzeigen, den Zeitbereich anzupassen und auf zusätzliche Diagrammoptionen zuzugreifen.

    Hinweis:
    Ein Fehlerbudget ist der Betrag des Fehlers, den ein Service erleben kann, bevor er sein SLO verletzt.
    Jede Visualisierung enthält auch eine Trendlinie, die Änderungen bei der Anzahl der Services in den letzten 12 Monaten anzeigt. Kleinere Zahlen geben an, wie sich die Anzahl im Vergleich zu vor einer Woche geändert hat, z. B. ↓25 (22 %) seit Juni 11.
    Diagramm Was es ist Verwendung
    Kritisch Zeigt die Anzahl der Services in einem kritischen Status an. Für kritische Services verbleiben 0 % Fehlerbudget in ihren SLOs. Zeigen Sie an, wie viele Services ihre Fehlerbudgets verbraucht haben, und identifizieren Sie die Services, die sofortige Aufmerksamkeit erfordern.
    Gefährdet Zeigt die Anzahl der gefährdeten Services an. Gefährdete Services haben <= 25 % Fehlerbudget in ihren SLOs. Überwachen Sie, wie viele Services sich kritischen Schwellenwerten nähern, und finden Sie Probleme frühzeitig.
    Stabil Zeigt die Anzahl der stabilen Services an. Für stabile Services verbleiben mehr als 25 % Fehlerbudget in ihren SLOs. Erhalten Sie Einblicke in die allgemeine Serviceintegrität, und identifizieren Sie, ob Services im Laufe der Zeit zuverlässig bleiben.

    Risikotrends im Zeitverlauf

    Liniendiagramme verfolgen die Anzahl der SLOs mit hohen Durchsatzraten und geringem Fehlerbudget, das in den letzten 12 Monaten verbleibt. Sie können sie verwenden, um wiederkehrende Muster und potenzielle Zuverlässigkeitsrisiken zu finden.
    Diagramm Was es ist Verwendung
    Hohe Durchsatzrate (>=1) Zeigt die Anzahl der SLOs mit einer Durchsatzrate >= 1 im Zeitverlauf an. Eine hohe Durchsatzrate weist darauf hin, dass der mit dem SLO verknüpfte Service wahrscheinlich sein Fehlerbudget vor Ende des Compliance-Zeitraums verletzt.

    Wenn ein Service beispielsweise 30 Tage hat, um sein SLO zu erfüllen, sein Fehlerbudget jedoch innerhalb von 15 Tagen aufgebraucht wird, beträgt die Durchsatzrate 2.

    • Erkennen Sie Risiken früh, indem Sie sehen, wann Services zu schnell Fehlerbudgets verbrauchen.
    • Identifizieren Sie neu auftretende oder wiederkehrende Zuverlässigkeitsprobleme, indem Sie die Durchsatzraten im Laufe der Zeit nachverfolgen.
    • Zeigen Sie auf das Diagramm, um die Anzahl und den Prozentsatz der SLOs mit einem hohen Durchsatz zu diesem Zeitpunkt anzuzeigen.
    • Wählen Sie das Diagramm aus, um SLO-Details anzuzeigen, einschließlich gemessener Zuverlässigkeit, Durchsatz und Prozentsatz des verbleibenden Fehlerbudgets.
    Geringes verbleibendes Budget (<=25 %) Zeigt die Anzahl der SLOs an, bei denen im Laufe der Zeit ein niedriges oder kein verbleibendes Fehlerbudget vorhanden ist.
    • Überwachen Sie, wie viele Services sich nähern oder ihre SLOs verletzt haben.
    • Verfolgen Sie steigende Trends, die auf eine abnehmende Zuverlässigkeit oder wiederkehrende Probleme hinweisen können, die untersucht werden müssen.
    • Zeigen Sie auf das Diagramm, um die Anzahl und den Prozentsatz der SLOs anzuzeigen, deren Fehlerbudget zu diesem Zeitpunkt gering oder gar nicht verbleibt.
    • Wählen Sie das Diagramm aus, um SLO-Details anzuzeigen, den Zeitbereich anzupassen und auf zusätzliche Diagrammoptionen zuzugreifen.

    Tabelle „Servicelevel-Ziele (SLOs)“

    Die Tabelle „SLOs“ listet die in Service Reliability Management (SRM) definierten SLOs auf, und sie wird standardmäßig nach SLO-Namen sortiert. Verwenden Sie die Tabelle, um die allgemeine Zuverlässigkeit zu überwachen, gefährdete Services zu identifizieren und die zugewiesenen Teams zu finden.

    Die SLO-Tabelle enthält standardmäßig die folgenden Spalten. Um die angezeigten Spalten anzupassen, wählen Sie das Zahnradsymbol aus.
    • Name: Name des SLO. Sie können den Pfeil auswählen, um die Tabelle nach SLO-Namen zu sortieren, und den Namen auswählen, um den SLO-Datensatz anzuzeigen.
    • Zuverlässigkeit: Aktueller Status des SLO. Zum Beispiel stabil, gefährdet oder kritisch.
    • Gemessene Zuverlässigkeit: Prozentsatz, der die tatsächliche Leistung des Service anzeigt. Wenn Ihr SLO beispielsweise 99 % erfolgreich ist und die tatsächliche Leistung für den Monat 99 % beträgt, beträgt die gemessene Zuverlässigkeit 99 %.
    • Ziel (Prozentsatz): Ziel-SLO-Wert.
    • Durchsatz: Numerischer Wert, der angibt, wie schnell der Service sein Fehlerbudget verbraucht.
    • % Verbleibendes Fehlerbudget: Prozentsatz des Fehlerbudgets, das im aktuellen Compliance-Zeitraum noch verfügbar ist.
    • Service: Name des Service, der dem SLO zugeordnet ist. Sie können den Servicenamen auswählen, um den Servicedatensatz anzuzeigen.
    • Zugewiesen: Team, das für den Service verantwortlich ist.

    Dashboard-Filter und -Aktionen

    Das Dashboard „Service Reliability“ wurde mit Platform Analytics erstellt und enthält Standard-Dashboard-Funktionen. Details zum Anpassen, Duplizieren oder Freigeben von Dashboards finden Sie unter Dashboards in Platform Analytics Dokumentation.
    Hinweis:
    Änderungen am Dashboard „Service Reliability“ wirken sich auf alle SRM-Anwender in Ihrer Instanz aus. Um eine personalisierte Version zu erstellen, erstellen Sie entweder ein neues Dashboard, oder duplizieren Sie das vorhandene Dashboard, und bearbeiten Sie es. Weitere Informationen finden Sie in Create a dashboard with the in-line editor Und Duplicate a Platform Analytics dashboard.