サービスリライアビリティ管理 の探索
サービスリライアビリティ管理 (SRM) は、チームがサービスヘルスを管理するためのセルフサービスのガイド付きエクスペリエンスを提供します。このエクスペリエンスは、サービスオペレーションワークスペースアプリケーションを使用して構築され、ITOM と ITSM の機能を単一のワークフローに統合します。
SRMの概要
サイト信頼性エンジニアリング (SRE) プラクティスを使用してサービスヘルスを最適化します。 SRM は、チームが SRE を使用してデジタルサービスの信頼性を向上できるようにする単一の運用ワークスペースです。
- オンコールエスカレーションを使用して、問題にタイムリーに対応します。
- ガイド付きセルフサービスでセットアップの手間を軽減して、分散したチームをオンボーディングします。また、分離されたデータを使用し、権限化されたアクセスを提供し、中心となる IT を使用して最小限の管理を行います。
SRM をインストールすると、いくつかのプラグインとアプリケーションも有効になります。詳細については、「ITOM ヘルス とともにインストールされるプラグインまたはアプリケーション」を参照してください。
SRM ユーザー
| ユーザー | 説明 | 含まれるロール |
|---|---|---|
| アドミン |
ServiceNow アドミニストレーターは、ServiceNow プラットフォームの管理、開発、運用、教育、およびメンテナンスを担当します。 インストールを担当し、SRM の サービスオペレーションワークスペース アドミンセンターの構成を実行できます。 |
すべて |
| アドミニストレーター [srm_admin] 注: このロールは、 ServiceNow admin ロールとは異なります。 |
SRM アドミニストレーターは、アカウント設定、構成、およびユーザーを管理できます。 アドミニストレーターは、以下のアクションを実行できます。
|
|
| マネージャー [srm_manager] | マネージャーは、SRE チームを監督します。マネージャーは、チームのオンコールスケジュールに SRE をアサインし、パフォーマンスを監視して、インシデントを処理してソリューションを開発するための手順を作成します。マネージャーは、すべてのシステムと DevOps ワークフロー全体のレジリエンスを促進します。 マネージャーは、チームのコンテキスト内で次のアクションを実行できます。
|
レスポンダー |
| レスポンダー [srm_responder] |
SRM を使用して日常業務を実行するサービス信頼性エンジニア (SRE)。レスポンダーは、オンコールでインシデントを診断および修復します。 レスポンダーは、自分が属する構成にのみアクセスできます。権限を持つアラートまたはインシデントにのみアクセスできます。 SRE は、チームのコンテキスト内で次のアクションを実行できます。
|
以下を含む 17 のロールを継承します。
|
詳細については、「SRM のロールと責任」を参照してください。
SRM のワークフロー
- IT または LOB (基幹業務) の製品チームは、新しい技術サービスやアプリケーションサービスを継続的に提供します。例:新規顧客請求ポータル。
- SLO 管理に加えて、チームはサービスを登録し、サービスレベル目標 (SLO) を定義して、ビジネス成果の達成に役立てることができます。例:請求ポータルの月間可用性が 95%。
- Monitoring 統合はチームが設定し、これらのサービスの正常性をリアルタイムに収集します。例:クラウド可観測性。
- Monitoring では、サービスのパフォーマンスが低下している場合にアラートに影響を与えるサービスレベルインジケーター (SLI) が作成されます。自動化のグループ化と拡張。例:請求ポータルの待機時間が 7 秒を超えている。
- アラートが機能停止または顧客に影響を与えるデグレードを示している場合、インシデントが作成され、オンコール通知が適切なチームリソースに通知されます。例:請求ポータルの遅延の問題が請求処理 SRE チームに電話で通知されます。
- チームは、インシデントを共同で診断して修復した後、システムのレジリエンスを向上させるためのアクションアイテムを特定します。例:請求チームは、Web サーバーの容量を追加することを決定した。
- 経営陣は、SLO パフォーマンスを継続的にレビューし、エラー予算が尽きたときに変更されないようにし、パフォーマンスの低いサービスの改善イニシアチブを優先します。
SRM のメリット
| メリット | 機能 | ユーザー |
|---|---|---|
| チームベースのエクスペリエンス | SRM チームの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| サービス登録 | SRM サービスの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| 事前に構築された統合 | SRM 統合の操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| サービスヘルスの測定 | 信頼性メトリクスの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| オンコールカバー範囲 | SRMオンコールスケジュールの作成 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| 重大度の高いアラートとインシデントの修復 | SRM の信頼性タスクの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
次に探索する内容
SRM の構成と使用の詳細については、以下を参照してください。