SRM サービスの操作
サービスは、1 つのチームが所有するネットワーク、支払い、HR サービスなどの機能的な成果を表します。その成果を実現するため、サービスには、ユーザー認証サービスなどの 1 つ以上の技術コンポーネント、またはデータベースなどの共有インフラストラクチャを含めることができます。
サービスリライアビリティ管理 (SRM) は統合と連携し、アラートに優先順位を付けて関連するレスポンダーにルーティングします。アラートが確認され、誰かが応答するまで、エスカレーションでフォローアップします。SRMでサービスを作成または追加するときは、SRMインフラストラクチャのサービスが反映されている必要があります。
注:
各 技術管理サービスを 監視し、それらのツールからイベントを受信するには、複数のツール統合が必要になる場合があります。詳細については、「SRMでの統合の操作」を参照してください。
さらに、サービスの信頼性メトリクスを作成できます。「信頼性メトリクスの操作」を参照してください。
チームとポリシーをそのサービスに結び付けると、責任を分割し、技術的な成果を追跡することが容易になります。また、簡単に応答ルーチンを自動化し、誰にいつ通知するかに集中することができます。
既存のサービスのステータスは継承されます。SRMで作成されたサービスのステータスは [なし] です。
サービスの概要
[概要] タブのカードには、次のメトリクスが表示されます。デフォルトでは、リストビューには [自分のサービス] カードに関連する情報が表示されます。別のカードを選択すると、リストビューに別の情報が表示されます。
- 自分のサービス:自分またはチームが管理し、信頼性を監視しているすべてのサービスの数。
- アクティブなインシデントを含むサービス:次の順序でソートされたオープンインシデントを含むサービス:
- 事業上の重要度 - 最も重要なものから順に。
- アクティブなインシデントの数 - 高いものから順に。
- エラー予算残額の割合 (低いものから順)。
- 重大なアラートを含むサービス:オープンアラートを含むサービスが次の順序でソートされています。
- 事業上の重要度 - 最も重要なものから順に。
- アラートの数 - 高いものから順に。
- エラー予算残額の割合 (低いものから順)。
- オープン中の変更を含むサービス (Services with open changes):チームが管理および監視しているすべてのサービス。
- エラー予算が低いサービス:エラー予算残額が 25% 未満のサービス。
エラー予算メトリクスは、指定された時間に費やすことができるサービスレベル目標 (SLO) の金額として表されます。リリース速度の管理に使用できます。
注:
カードとリストの値を更新するには、[更新]
を選択します。
このリストは、次の方法で操作できます。
- 列をグループ化またはフィルタリングしてビューをカスタマイズします。
- 必要に応じて、リストを編集、ソート、またはエクスポートします。「リスト情報のファイルへのエクスポート」を参照してください。
個々のサービスの詳細については、「 サービスの詳細フォームの編集」を参照してください。
サービスリストビューの定義
列には次の詳細が含まれます。
- サービス:サービスの名前。
- クラス: サービスインスタンスまたは技術管理サービス。
- 事業上の重要度:ビジネスに対するサービスの重要性。
- オープンアラート:サービスにアサインされているオープンアラートの数。
- オープンインシデント:サービスにアサインされているオープンインシデントの数。
- エラー予算残額:サービスのエラー予算残額の割合。
サービス信頼性
[サービスの信頼性] タブは、高レベルのサービスパフォーマンスを示すカスタマイズ可能なダッシュボードです。ダッシュボードの詳細については、「サービス信頼性ダッシュボードの可視化」を参照してください。