自動アラートグループ化
自動アラートグループ化は、履歴データを使用して類似のアラートを自動的にグループに整理するプロセスです。これらのアラートは、サーバーエラーやネットワーク停止などのシステムの問題である可能性があります。関連するアラートをグループ化することで、チームはパターンをすばやく特定し、繰り返し発生する問題を管理し、個々のアラートが多すぎることによるノイズを減らすことができます。
都市の交通システムを監視していると想像してください。事故、交通渋滞、通行止めの報告など、多くのアラートが届きます。自動アラートグループ化は、パターンに基づいてこれらのアラートを整理するスマートアシスタントのように機能するため、関連する問題をまとめて確認し、より効率的に対応することができます。これらの自動アラートグループは、サービスオペレーションワークスペース内のExpress Listに表示されます。
このグループ化を有効にする方法
アラート相関の機械学習ベースの自動化を有効にするには、プロパティ [ML ベースの自動化相関を有効にする (sa_analytics.specific_patterns_enabled)] を true に設定します。
Domain Support - Domain Extensions Installer が有効になっている場合、アラートアグリゲーションパターンは sa_analytics.agg.learner_domain_level プロパティで定義されたドメインレベルに基づいて作成されます。デフォルトでは、このドメインレベルはドメイン階層の第 2 レベルに対応する 2 に設定されています。たとえば、会社では、レベル 1 は会社自体を表し、レベル 2 は会社内の部門またはチームを表す場合があります。アラートは、部門やチームでソートするなど、この第 2 レベルに基づいてグループ化されます。 詳細については、 ドメインセパレーションと イベント管理を参照してください。
仕組み
自動アラートグループ化では、機械学習 (ML) と履歴データを使用してアラート間のパターンを識別します。問題のタイプ、影響を受けるシステム、CI、同様の期間内に複数回発生したメトリクスなど、パターン識別子と呼ばれる特定の特性を調べて、アラートが関連しているかどうかを判断します。 アラートアグリゲーション学習では、アルゴリズムを使用して、パターンに基づいてアラートをグループ化します。具体的には、パターンベースのアルゴリズムと確率的手法を使用して、受信アラートを分析し、関連するアラートを特定します。
- 履歴データの分析:システムは過去のアラートを調査して、パターンと関係を学習します。
- 機械学習の適用:ML アルゴリズムは、アラート履歴データを分析して、アラート間のパターンと関係を特定します。これにより、システムは過去のインシデントから学習し、時間の経過とともに類似のアラートをグループ化する機能を改善できます。
- 類似のアラートをグループ化:一致するパターンを含むアラートは自動的にグループ化されます。
- 8:00 AM: メインストリートでの事故
- 8:05 AM: メインストリート付近で渋滞
- 午前8時10分:メインストリートの通行止め
メリット
- 繰り返し発生する問題を見つける: パターン (サーバーが継続的に過熱するなど) をすばやく特定します。
- 時間の節約:個々のアラートではなく、関連するアラートのグループを処理します。
- 応答の改善:散在する問題に対処するのではなく、根本原因の修正に重点を置きます。