Datadog と SR Ops とのデータ連携
Datadog は、クラウドおよびアプリケーションの監視用として普及しているサービスです。Datadog を使用すると、アプリケーションレベルから実際のホストや VM に至るまで、スタック全体から詳細な測定基準を把握できます。Datadog は、サービスの監視測定基準やイベントに基づいてアラートを提供します。Datadog は検出された問題に対してアラートを生成し、SR Ops は適切なユーザーが問題に取り組んでいることを確認します。
測定基準値のアラートルールでは、指定した測定基準の値が割り当てられたしきい値を超えたときにアラートルールがアクティブになり、通知が送信されます。イベントのアラートルールでは、ルールはすべてのイベントに対して通知を送信することも、特定の数のイベントが発生した場合にのみ通知を送信することもできます。
SR Ops が Datadog ユーザーに提供する機能
SR Ops には、Datadog とのネイティブで強力な双方向データ連携があります。このデータ連携を使用して、Datadog アラートを SR Ops アラートと自動的に同期し、SR Ops の高機能なアラート通知システム、エスカレーション、およびオンコールローテーションのメリットを活用します。Datadog は、測定基準とイベントに基づいてアラートを生成します。SR Ops は、Datadog によって生成されたアラートのディスパッチャーとして機能します。SR Ops は、オンコールスケジュールとエスカレーションに基づいて、通知先にする適切なユーザーを決定し、メール、テキストメッセージ (SMS)、電話、および Android や iOS のプッシュ通知を使用して通知します。
- Datadog は、定義された条件が満たされるとアラートをトリガーします。Datadog でアラートが作成されると、データ連携によって SR Ops にもアラートが自動的に作成されます。
- SR Ops でアラートが確認されると、Datadog でもアラートが自動的に確認されます。
- SR Ops でアラートがクローズされると、Datadog でもアラートが自動的にクローズされます。
- アラートが SR Ops で任意のソース (Datadog 以外) から作成されたときに、SR Ops はそのアラートを Datadog に投稿できます (オプション)。
- Datadog からのアラートを確認 (またはクローズ) します。
- Datadog から送信されたアラートに基づいて、オンコール応答者に通知します。
- イベントをトリガーした測定基準/サービスレベルインジケーター (SLI) の可視化が含まれた拡張イベントデータを、Datadog から送信します。
- Datadog イベントペイロードからのイベントの重大度に基づいて、高緊急度および低緊急度のインシデントを作成します。
- インシデントとエスカレーションが更新されると、それらは SR Ops と Datadog の間で同期されます。
- 双方向の同期によって Datadog の測定基準が平常に戻ると、インシデントは SR Ops で自動的に解決されます。
データ連携の機能
Datadog でアラートが作成されると、データ連携によって SR Ops にアラートが自動的に作成されます。
指定範囲を外れた Datadog 測定基準は、SR Ops のサービスにイベントを送信します。Datadog からのイベントは、既存インシデントへのアラートとして、対応する SR Ops のサービスまたはグループで、新しいインシデントをトリガーします。
測定基準が指定範囲に戻ると、解決イベントが SR Ops サービスに送信され、アラートとそのサービスの関連インシデントが解決されます。