SRM信頼性メトリクスの表示
既存のサービスレベル目標 (SLO) とサービスレベルインジケーター (SLI) について説明します。
始める前に
必要なロール:srm_manager、srm_responder、または srm_admin
注:
アドミニストレーターは、任意の サービスリライアビリティ管理 (SRM) SLO を表示できます。
手順
- 移動先 ワークスペース > サービスオペレーションワークスペース.
-
プライマリナビゲーションで [サービス] アイコン (
) を選択します。
- サービスを選択し、[ 信頼性メトリクス] タブを選択して、SLO を開きます。
-
SLO ヘッダーを表示して、SLO、SLI、およびステータスに関する重要な情報を取得します。
ヘッダー要素 説明 SLI タイプ - 可用性:サービスが利用可能な時間の割合。
- エラー:サービスエラーの頻度。
- 遅延:要求のサービスに要した時間。
- 飽和度:リソース使用に焦点を当てたシステムの充実度。
SLO タイプ - 期間:サービスが違反なしで費やした時間を測定します。関連するメトリクスは次のとおりです。
- 目標 (パーセンテージ):サービスが満たすと予想される SLI のターゲットパーセンテージ。
- エラー予算:目標に違反するまでのエラー予算残額 (日数と時間)。
- カウント:コンプライアンス期間中の発生回数を測定します。関連するメトリクスは次のとおりです。
- 制限 (発生件数):違反をトリガーする発生件数。
- 残りの違反発生件数:違反が発生するまでに残っている発生件数。
状況 - ドラフト:SLO はまだアクティブではありません。新しい SLI を追加したり、既存の SLI を更新したり、SLO を削除したりできます。
- 実行中:SLO はアクティブです。SLO を編集、廃止、または削除できます。実行中の SLO を編集すると、その SLO は自動的に廃止され、新しいコピーが作成されます。詳細については、「信頼性メトリクスの編集」を参照してください。
- 廃止:SLO はアクティブでなくなりました。必要に応じて、再度アクティブ化できます。
サービス SLO に関連付けられたサービス。 信頼性 - 安定:すべての SLO でエラー予算の 25% 以上が残っています。
- リスクあり:すべての SLO にいくらかのエラー予算が残っていますが、少なくとも 1 つの SLO の残りのエラー予算が 25% 未満です。
- 重大:少なくとも 1 つの SLO でエラー予算が完全に使用されています。
注:ヘッダーから、SLO を削除、廃止、または編集できます。SLO を削除すると、関連する SLI も削除されます。SLO を廃止するとステータスが変わりますが、後で SLO ページまたは [信頼性メトリクス] タブから再アクティブ化できます。 -
[ 概要 ] タブを選択して、SLO のサマリーメトリクスとパフォーマンスチャートを表示します。
- 履歴期間:時間範囲を選択します。利用可能な期間は、SLO の作成日から現在までの定義された増分です。
- サマリーメトリクス:構成された SLI とエラー予算ポリシーのしきい値に応じて、SLO パフォーマンスに関する詳細を表示します。
- サービスレベルインジケーター:SLO に関連付けられた SLI を表示します。
- サービスレベル目標 (SLO) の履歴:
- 期間 SLO については、使用したエラー予算、残りのエラー予算、およびバーンレートのグラフを表示します。
- カウント SLO の場合は、累積違反発生件数、バーンレート、およびこのサービスに影響を与えるアラート、インシデントと変更のチャートを表示します。
チャートをポイントすると、日次値を表示できます。
-
[ 詳細]、[ サービスレベルインジケーター]、および [エラー予算ポリシー ] タブを選択して、主要な構成の詳細を表示します。
表示される詳細については、「 SLO フォームの作成」、「 SLI の作成フォーム、および エラー予算ポリシーフォームの追加」を参照してください。[エラー予算ポリシー] タブで、[ ポリシーの追加 ] を選択して、パフォーマンスデータに基づいてアクションを定義できます。
[詳細] タブには、信頼性メトリクスの変更を記録および追跡するための [作業メモ] フィールドと [アクティビティ] パネルもあります。
次のタスク
SLO を作成または編集する方法については、「 SLO、SLI、およびエラー予算ポリシーの作成 と 信頼性メトリクスの編集」を参照してください。