Service Reliability Management erkunden

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 3 Minuten Lesedauer
  • Service Reliability Management( SRM) Bietet Teams eine geführte Selfservice-Experience zur Verwaltung der Serviceintegrität. Die Experience wird mit der Anwendung Service Operations-Arbeitsbereich erstellt und kombiniert ITOM- und ITSM-Fähigkeiten in einem einzigen Workflow.

    SRM – Übersicht

    Optimieren Sie die Serviceintegrität mit Praktiken von Site Reliability Engineering (SRE). SRM Ist ein einzelner Betriebsarbeitsbereich, mit dem Teams die Zuverlässigkeit digitaler Services mit SRE verbessern können.
    • Verwenden Sie Rufbereitschaftseskalationen, um rechtzeitig auf Probleme zu reagieren.
    • Reduzieren Sie die Setup-Reibung mit dem geführten Selfservice, um verteilte Teams mit getrennten Daten, erweitertem Zugriff und minimaler Governance von der zentralen IT zu onboarden.

    Wenn SRM Ist installiert, werden auch mehrere Plugins und Anwendungen aktiviert. Weitere Informationen finden Sie unter Mit installierte Plugins oder Anwendungen ITOM-Integrität.

    SRM – Anwender

    Tabelle : 1. Anwender
    Anwender Beschreibung Enthält Rollen
    Administrator

    Ein ServiceNow-Administrator ist für Verwaltung, Entwicklung, Betrieb, Schulung und Wartung der ServiceNow Platform verantwortlich.

    Verantwortlich für die Installation und kann die Service Operations-Arbeitsbereich Admin Center-Konfiguration von SRM durchführen.

    Alle
    Administrator [srm_admin]
    Hinweis:
    Diese Rolle unterscheidet sich von ServiceNow administratorrolle.

    SRM-Administratoren können Accounteinstellungen, Konfigurationen und Benutzer verwalten.

    Administratoren können folgende Aktionen ausführen:
    • Alle SRM-Konfigurationen erstellen, bearbeiten oder löschen und darauf zugreifen.
    • Integrationen hinzufügen oder verwalten.
    • Erstellen Sie Integrationen mit APM-Tools (Application Performance Monitoring).
    • Richten Sie Zuverlässigkeitsmetriken ein, und verwalten Sie sie.
    • Richten Sie Fehlerbudgetrichtlinien ein, und verwalten Sie sie.
    • Manager
    • Beantworter
    Manager [srm_Manager] Manager überwachen ein Team von SREs. Manager weisen dem Rufbereitschaftszeitplan des Teams SREs zu, überwachen ihre Leistung und erstellen Verfahren zur Behandlung von Incidents und zur Entwicklung von Lösungen. Manager fördern Resilienz in allen Systemen und DevOps-Workflows.
    Manager können im Kontext ihrer Teams folgende Aktionen ausführen:
    • Definieren und richten Sie Teams, Rufbereitschaftszeitpläne und Services ein.
    • Fügen Sie Anwender wie Beantworter und Manager für die Teams hinzu, denen sie angehören, und löschen Sie sie.
    • Integrationen hinzufügen oder verwalten.
    • Erstellen Sie Integrationen mit APM-Tools (Application Performance Monitoring).
    • Richten Sie Zuverlässigkeitsmetriken ein, und verwalten Sie sie.
    • Richten Sie Fehlerbudgetrichtlinien ein, und verwalten Sie sie.
    Beantworter
    Beantworter [srm_Responder]

    Ein Service Reliability Engineer (SRE), der SRM zur Ausführung alltäglicher Aufgaben verwendet. Beantworter sind die Personen, die Rufbereitschaft haben und Incidents diagnostizieren und beheben.

    Beantworter können nur auf Konfigurationen zugreifen, denen sie angehören. Sie können nur auf die Warnungen oder Incidents zugreifen, für die sie Berechtigungen haben.

    SREs können im Kontext ihrer Teams folgende Aktionen ausführen:
    • Richten Sie Services, Teams und Integrationen ein.
    • Bestätigen Sie ihre Rufbereitschaftszeitpläne.
    • Verwalten Sie Incident- und Warnungsdatensätze.
    • Aktualisieren Sie die von ihnen erstellten Teams.
    • Weitere Beantworter hinzufügen
    • Erstellen Sie Integrationen mit APM-Tools (Application Performance Monitoring).
    • Richten Sie Zuverlässigkeitsmetriken ein, und verwalten Sie sie.
    • Richten Sie Fehlerbudgetaktionen ein, und verwalten Sie sie.
    Erbt 17 Rollen, darunter die folgenden:
    • cmdb_read
    • sn_sow.sow_user
    • sn_sow_srm.srm_responder
    • workspace_user
    • slo_Operator

    Weitere Informationen finden Sie unter SRM Rollen und Verantwortlichkeiten.

    SRM – Workflow

    Infografik, die zeigt, wie Beantworter, Manager und Administratoren Teams verwalten, Services registrieren, SLO definieren, Integrationen überwachen, auf Benachrichtigungen reagieren, und beheben Sie Incidents. Einzelheiten finden Sie in der nachfolgenden Beschreibung.
    1. Produktteams in IT oder Geschäftsbereichen stellen kontinuierlich neue technische Services und Anwendungsservices bereit. Beispiel: Neues Kundenabrechnungsportal.
    2. Zusammen mit SLO-Management, Teams können Services registrieren und Servicelevel-Ziele (Service Level Objectives, SLOs) definieren, um Geschäftsergebnisse zu erreichen. Beispiel: 95 % monatliche Verfügbarkeit für das Abrechnungsportal.
    3. Überwachungsintegrationen werden von den Teams eingerichtet, um die Echtzeitintegrität dieser Services zu erfassen. Beispiel: Cloud Observability.
    4. Bei der Überwachung werden Servicelevel-Indikatoren (Service Level Indicators, SLIs) erstellt, die sich auf Warnungen auswirken, wenn Services unterdurchschnittlich sind. Automatisierungsgruppen und Ergänzungen. Beispiel: Die Latenz des Abrechnungsportals überschreitet 7 s.
    5. Wenn die Warnungen auf einen Ausfall oder eine Verschlechterung hinweisen, die sich auf den Kunden auswirkt, werden Incidents erstellt, und Rufbereitschaftsbenachrichtigungen benachrichtigen die entsprechenden Teamressourcen. Beispiel: Ein Abrechnungs-SRE-Team wird telefonisch über ein Latenzproblem im Abrechnungsportal benachrichtigt.
    6. Nachdem Teams Incidents gemeinsam diagnostiziert und behoben haben, identifizieren sie Aktionselemente zur Verbesserung der Resilienz des Systems. Beispiel: Das Abrechnungsteam entscheidet sich, zusätzliche Webserverkapazität hinzuzufügen.
    7. Das Management überprüft kontinuierlich die SLO-Leistung, hilft, Änderungen zu verhindern, wenn das Fehlerbudget erschöpft ist, und priorisiert Verbesserungsinitiativen für unterdurchschnittliche Services.

    SRM – Vorteile

    Vorteil Funktion Anwender
    Teambasierte Experience Mit SRM-Teams arbeiten SRM-Administratoren, Manager und Beantworter
    Serviceregistrierung Mit SRM-Services arbeiten SRM-Administratoren, Manager und Beantworter
    Vorgefertigte Integrationen Mit SRM-Integrationen arbeiten SRM-Administratoren, Manager und Beantworter
    Messen Sie die Serviceintegrität Arbeiten mit Zuverlässigkeitsmetriken SRM-Administratoren, Manager und Beantworter
    Rufbereitschaftsabdeckung Erstellen Sie einen SRM Rufbereitschaftszeitplan SRM-Administratoren, Manager und Beantworter
    Beheben Sie Warnungen und Incidents mit hohem Schweregrad Mit SRM-Zuverlässigkeitsaufgaben arbeiten SRM-Administratoren, Manager und Beantworter