サービスリライアビリティ管理 の探索

  • リリースバージョン: Zurich
  • 更新日 2025年07月31日
  • 所要時間:5分
  • サービスリライアビリティ管理 (SRM) は、チームがサービスヘルスを管理するためのセルフサービスのガイド付きエクスペリエンスを提供します。このエクスペリエンスは、サービスオペレーションワークスペースアプリケーションを使用して構築され、ITOM と ITSM の機能を単一のワークフローに統合します。

    SRMの概要

    サイト信頼性エンジニアリング (SRE) プラクティスを使用してサービスヘルスを最適化します。 SRM は、チームが SRE を使用してデジタルサービスの信頼性を向上できるようにする単一の運用ワークスペースです。
    • オンコールエスカレーションを使用して、問題にタイムリーに対応します。
    • ガイド付きセルフサービスでセットアップの手間を軽減して、分散したチームをオンボーディングします。また、分離されたデータを使用し、権限化されたアクセスを提供し、中心となる IT を使用して最小限の管理を行います。

    SRM をインストールすると、いくつかのプラグインとアプリケーションも有効になります。詳細については、「ITOM ヘルス とともにインストールされるプラグインまたはアプリケーション」を参照してください。

    SRM ユーザー

    表 : 1. ユーザー
    ユーザー 説明 含まれるロール
    アドミン

    ServiceNow アドミニストレーターは、ServiceNow プラットフォームの管理、開発、運用、教育、およびメンテナンスを担当します。

    インストールを担当し、SRMサービスオペレーションワークスペース アドミンセンターの構成を実行できます。

    すべて
    アドミニストレーター [srm_admin]
    注:
    このロールは、 ServiceNow admin ロールとは異なります。

    SRM アドミニストレーターは、アカウント設定、構成、およびユーザーを管理できます。

    アドミニストレーターは、以下のアクションを実行できます。
    • すべての SRM 構成に対するアクセス、作成、編集、または削除。
    • 統合の追加または管理。
    • Application Performance Monitoring (APM) ツールとの統合を作成します。
    • 信頼性メトリクスを設定して管理します。
    • エラー予算ポリシーの設定と管理。
    • マネージャー
    • レスポンダー
    マネージャー [srm_manager] マネージャーは、SRE チームを監督します。マネージャーは、チームのオンコールスケジュールに SRE をアサインし、パフォーマンスを監視して、インシデントを処理してソリューションを開発するための手順を作成します。マネージャーは、すべてのシステムと DevOps ワークフロー全体のレジリエンスを促進します。
    マネージャーは、チームのコンテキスト内で次のアクションを実行できます。
    • チーム、オンコールスケジュール、およびサービスを定義して設定します。
    • ユーザーが属するチームのレスポンダーやマネージャーなどのユーザーを追加および削除します。
    • 統合の追加または管理。
    • Application Performance Monitoring (APM) ツールとの統合を作成します。
    • 信頼性メトリクスを設定して管理します。
    • エラー予算ポリシーの設定と管理。
    レスポンダー
    レスポンダー [srm_responder]

    SRM を使用して日常業務を実行するサービス信頼性エンジニア (SRE)。レスポンダーは、オンコールでインシデントを診断および修復します。

    レスポンダーは、自分が属する構成にのみアクセスできます。権限を持つアラートまたはインシデントにのみアクセスできます。

    SRE は、チームのコンテキスト内で次のアクションを実行できます。
    • サービス、チーム、および統合を設定します。
    • オンコールスケジュールを確認します。
    • インシデントとアラートのレコードを管理します。
    • 作成したチームを更新します。
    • 他のレスポンダーの追加
    • Application Performance Monitoring (APM) ツールとの統合を作成します。
    • 信頼性メトリクスを設定して管理します。
    • エラー予算アクションの設定と管理。
    以下を含む 17 のロールを継承します。
    • cmdb_read
    • sn_sow.sow_user
    • sn_sow_srm.srm_responder
    • workspace_user
    • slo_operator

    詳細については、「SRM のロールと責任」を参照してください。

    SRM のワークフロー

    レスポンダー、マネージャー、およびアドミニストレーターが、チームの管理、サービスの登録、SLO の定義、統合の監視、通知への応答、およびインシデントの修復を行う方法を示すインフォグラフィック。詳細については、以下の説明を参照してください。
    1. IT または LOB (基幹業務) の製品チームは、新しい技術サービスやアプリケーションサービスを継続的に提供します。例:新規顧客請求ポータル。
    2. SLO 管理に加えて、チームはサービスを登録し、サービスレベル目標 (SLO) を定義して、ビジネス成果の達成に役立てることができます。例:請求ポータルの月間可用性が 95%。
    3. Monitoring 統合はチームが設定し、これらのサービスの正常性をリアルタイムに収集します。例:クラウド可観測性。
    4. Monitoring では、サービスのパフォーマンスが低下している場合にアラートに影響を与えるサービスレベルインジケーター (SLI) が作成されます。自動化のグループ化と拡張。例:請求ポータルの待機時間が 7 秒を超えている。
    5. アラートが機能停止または顧客に影響を与えるデグレードを示している場合、インシデントが作成され、オンコール通知が適切なチームリソースに通知されます。例:請求ポータルの遅延の問題が請求処理 SRE チームに電話で通知されます。
    6. チームは、インシデントを共同で診断して修復した後、システムのレジリエンスを向上させるためのアクションアイテムを特定します。例:請求チームは、Web サーバーの容量を追加することを決定した。
    7. 経営陣は、SLO パフォーマンスを継続的にレビューし、エラー予算が尽きたときに変更されないようにし、パフォーマンスの低いサービスの改善イニシアチブを優先します。

    SRM のメリット

    メリット 機能 ユーザー
    チームベースのエクスペリエンス SRM チームの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    サービス登録 SRM サービスの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    事前に構築された統合 SRM 統合の操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    サービスヘルスの測定 信頼性メトリクスの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    オンコールカバー範囲 SRMオンコールスケジュールの作成 SRM アドミニストレーター、マネージャー、およびレスポンダー
    重大度の高いアラートとインシデントの修復 SRM の信頼性タスクの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー