サービスリライアビリティ管理の使用を開始するには
サービスリライアビリティ管理 (SRM) は、サービスレベル目標とインシデント解決の観点からサービスヘルスを確認するためのプロセスを加速させます。目標とするアジリティ、パフォーマンス、アップタイムを IT 運用チームと DevOps チームが実現できるように支援します。
SRM の使用を開始して、SRM インターフェイスのさまざまなセクションを確認します。
ロールに関する詳細については、「SRM のロールと責任」を参照してください。
基本的な SRM タスク
| ステップ | 説明 | 参照 |
|---|---|---|
| チームとサービスのセットアップ | [ホーム]、[サービス]、および [チーム] の各ページのセットアップガイドには、チームまたはサービスを SRM に追加する方法が記載されています。 | SRM チームの追加 |
| ホームページにアクセスして学ぶ | ホームページは、自分にとって最も重要な情報が表示される場所です。たとえば、重要なアラートやインシデントを含むサービスや、自分と自分のチームにアサインされた作業などです。 | SRMホームページ |
| SRM の操作方法を学ぶ | SRM インターフェイスのさまざまなセクションと要素について理解を深めます。セクションと要素は、ドキュメント全体で使用されます。 | SRM インターフェイス |
SRM は、チーム、サービス、および統合を作成および管理する必要がある場合に役立ちます。
| ステップ | 説明 | 参照資料 |
|---|---|---|
|
SRMでのサービスインスタンスまたは技術管理サービスの管理 |
サービスとその動作を構成する基本的なタスクとパラメーターを定義します。 | SRM へのサービスの追加 |
|
SRM チームの設定 |
チームを設定します。チームは、関連するサービスで発生する問題に責任を負います。 | SRM チームの追加 |
|
オンコールスケジュールとエスカレーションポリシーの設定 |
チームのオンコールスケジュールを作成し、チームが問題を解決できるようにします。チームのエスカレーションポリシーを設定し、少なくとも 1 人のチームメンバーがインシデント応答に関与できるようにします。 | SRMオンコールスケジュールの作成 |
|
サービス関係の構成 |
マップキャンバスを使用して、サービスを追加、構成、および配置します。親サービスに依存する子サービスを追加できます。 | 親サービスへの子サービスの影響の表示 |
|
サービスとサードパーティのモニタリングツールとの統合 |
SRM とのサードパーティ統合 (Datadog や ServiceNow クラウドオブザーバビリティ など) を設定して、SRM 内でアラートがチームに表示されるようにします。 | SRMでの統合の操作 |
|
サービスの SLO、SLI、エラー予算の確立 |
サービスの適切な運用に関する目標を設定します。また、契約上の影響を受けることなく技術システムの故障が許容される最長時間を指定します。 | サービスレベル目標管理 |
|
アラートの自動化の設定
注: この機能は、アラート自動化アプリケーションがインストールされている場合にのみ使用できます。 |
アラート自動化により、アラート条件を定義できます。各 APM ツールにアラートルールを設定して、APM ツールが SRM に通知を送信する条件を定義します。 | アラート自動化アプリケーションは、ServiceNow Store から入手できます。 |