サービスオブザーバビリティ の探索
サービスオブザーバビリティ は、運用チームが複雑で分散した本番システムでインシデントをトリアージおよび管理するのに役立ちます。外部アプリケーションパフォーマンスモニタリング (APM) システムのテレメトリと 構成管理データベース (CMDB) からの関連データを組み合わせ、両方を サービスオペレーションワークスペース (SOW) の単一のワークフローに表示します。
サービスオブザーバビリティの概要
サービスオブザーバビリティ 特定のサービスに関連する SOW の健全性メトリクスを表示します。メトリクスを外部 APM システムから取り込み、関連する構成アイテムの情報とともに CMDBに表示できます。
サービスオブザーバビリティ は、次の APM ベンダーをサポートしています。
- Amazon CloudWatch
- Datadog
- Dynatrace
- Microsoft Azure モニター
- New Relic
- SolarWinds オンプレミス
- Splunk 観測可能性
- MySQL
- PostgreSQL ( Splunk ではサポートされていません)
- RDS (リレーショナルデータベースサービス) (Amazon CloudWatch)
APMインスタンスを サービスオブザーバビリティに接続した後、APMデータの既存のタグを使用して、 CMDB 内のサービスをAPMメトリックにマップします。
このデータマッピングを使用すると サービスオブザーバビリティ 、ホストやデータベースなどのサービスに関連付けられた APM エンティティのメトリクスを、関連する構成アイテム (CI) の情報とともに 1 つの場所に表示できます。オペレーターは、APM メトリクス、関連する CI 情報、およびサービスに関連する現在のインシデントやアラートなどの有用なコンテキスト情報を使用して、サービスの健全性を把握します。
たとえば、 Dynatrace を使用して チェックアウト サービスを監視し、データベースとホストのメトリクスがタグ checkout-service を使用してそのサービスからの要求を示すとします。チェックアウトサービス CI を checkout-service でタグ付けされた APM データにマッピングすることで、サービスオブザーバビリティサービスに関連するデータベース、ホスト、および CI のメトリクスを取得し、それらを一緒に表示します。オペレーターは、 SOWを離れることなく、サービスに関連するエンティティの問題を特定し、緩和プロセスを絞り込むことができます。
サービスオブザーバビリティ ユーザー
| ユーザー | 説明 |
|---|---|
| システム管理者 |
バージョン 1.5 のみ。 システムアドミニストレーターは、ユーザーとチームを構成し、監視対象のサービスを登録し、 サービスオブザーバビリティ APM に接続して、それらのサービスをそのデータにマッピングします。また、 SOW |
| サービスオブザーバビリティ アドミン | バージョン 1.6.x 以降。 サービスオブザーバビリティ アドミニストレーターは、ユーザーとチームを構成し、 サービスオブザーバビリティ APM に接続して、そのデータにサービスをマッピングできます。また、 SOW内のデータを表示することもできます。アドミニストレーターは、メトリクスと関連情報の表示に使用するダッシュボードテンプレートをカスタマイズすることもできます。 |
| オペレーター/運用マネージャー 注: すべてのデータを表示するには、これらのユーザーが SRM グループタイプに属している必要があります。 |
オペレーターは、SOW内のインシデントをトリアージするときにサービスオブザーバビリティを使用します。サービスの基本的な健全性メトリクスに加えて、関連するインシデント、アラート、変更を表示できます。[ 観測可能性 ] タブに移動して、ホストやデータベースなどの関連エンティティからのメトリクスとともに追加のサービスメトリクスを表示することで、より詳細な情報を取得できます。 |
サービスオブザーバビリティ のワークフロー
アドミニストレーターは、サービスを登録し、APM メトリクスを接続し、サービスをそのデータにマッピングすることで、 サービスオブザーバビリティ を構成します。オペレーターは サービスオブザーバビリティ を使用して、別の関連エンティティがサービスのパフォーマンスによって表面化した問題を引き起こしているかどうかを判断します。
アドミニストレーターは次のことを行います。
- 事業上の重要度に基づいて、 サービスオブザーバビリティ で監視するサービスを決定します。
- 既存の APM インスタンスを サービスオブザーバビリティ に接続します。
- APM メトリクスデータで使用される APM ベースのタグに基づいて、そのデータを使用してサービスをマッピングします。
- メトリクスのグラフの表示に使用するテンプレートをカスタマイズします。
オペレーターまたはマネージャーは、次のことを行います。
- SOWでの作業中に、アラート、サービスダッシュボード、Express Listなどからサービスに関する問題を特定し、[サービスの詳細] ページに移動します。
- サービスの全体的な健全性メトリクスを、関連するインシデント、アラート、変更とともに表示します。メトリクスの 1 つが異常であると思われる場合は、[観測可能性] タブに移動します。
- より詳細なサービスメトリクスと関連エンティティからの情報を表示して、根本原因の調査を開始します。問題がシステムのスタックのさらに下にあることがわかった場合は、そのエンティティの所有権を特定して修復を開始します。
サービスオブザーバビリティ のメリット
| メリット | 機能 | ユーザー |
|---|---|---|
重要な信号とブリッジワークフローを一元化して、俊敏性と信頼性を向上させます。
|
. | 管理 |
| サービスに関連付けられたエンティティの結合メトリクスを表示することで、効率を高め、平均解決時間 (MTTR) を短縮します。爆発半径とインシデントの所有権の判断を開始できます。 | サービスヘルスメトリクスの表示 | 演算子 |
| システムに関連する変更と、サービスに関連付けられたアラートを 1 か所で確認できます。 | 全体的なサービス健全性の表示。 | 演算子 |
| ダッシュボードテンプレートをカスタマイズします。 | サービスオブザーバビリティダッシュボードテンプレートのカスタマイズ | 管理 |