アラートのグループ化

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:6分
  • アラートのグループ化は、共通の特性またはクライテリアに基づいて、関連するアラートをセットに編成して統合するプロセスです。これにより、ノイズが低減され、問題の効率的な優先順位付け、追跡、対処が容易になるため、アラート管理を簡素化するのに役立ちます。グループ化されたアラートは、関連インシデントの概要をより明確に示し、より迅速な根本原因分析と修復を促進します。

    アラートのグループ化のアプローチ

    アラートのグループ化にはいくつかのアプローチがあります。手動、ルールベース、タグクラスターなど、ユーザー定義のロジックに依存する方法もあれば、自動、CMDB、テキストベース、ログアナリティクスなど、微調整が可能な高度なアルゴリズムを使用する方法もあります。

    表 : 1. アラートのグループ化のタイプとユースケース
    タイプ 説明 ユースケース
    ログアナリティクスによるグループ化 アラートは、ログデータの分析に基づいてグループ化されます。これには、関連インシデントと問題を特定するためのログエントリの相関が含まれます。この方法では、ログのパターンとシーケンスを活用することで、IT 環境全体で複雑なマルチステップの問題を検出できます。 オンラインゲーム会社は、ゲームサーバーからのログを監視して問題を検出します。ログ分析は、サーバーがクラッシュする前に発生するエラーのパターンを特定します。これらの関連アラートはグループ化されているため、IT チームは、根本原因 (クラッシュの原因となっているゲームコードの特定のバグなど) を調査して修正できます。
    ルールベースのグループ化 アラートは、ユーザーが設定した事前定義済みのルールとクライテリアに従ってグループ化されます。これらのルールには、しきい値やイベントタイプなどの特定の条件を含めることができます。この方法は、一貫性のある繰り返し可能なパターンに有効ですが、ルールのメンテナンスが必要です。 ある企業は、トラフィックの多い期間に e コマース Web サイトからのアラートをグループ化するルールを設定します。フラッシュセール中は、応答時間の遅さやタイムアウトに関する複数のアラートが、これらの特定の条件を識別する事前定義済みのルールに基づいてグループ化されるため、IT チームはサーバーの過負荷という根底にある問題を迅速に特定して対処できます。
    自動グループ化

    高度なアルゴリズムにより、アラートデータのパターンと類似性に基づいて、関連するアラートが自動的に識別され、グループ化されます。この方法では、機械学習と AI を活用して新しい問題や未知の問題に適応し、プロアクティブなアラート管理を提供します。

    イベント管理 は、類似しているが必ずしも同一ではないアラートを、前回のイベント生成時間の近接度に基づいてグループ化します。同じ CI を含むアラートがグループ化されます。

    自動アラートグループ化は、次のコンポーネントで構成されています。
    • アラートアグリゲーション学習 (サービスアナリティクスでのアラートアグリゲーション学習 - 日次):このオフラインジョブは、過去のアラートを処理するために毎日実行され、統計アナリティクスを実行してアラートのパターンをビルドします。詳細については、「パターンベースのアラートアグリゲーションの構成」を参照してください。
    • リアルタイムアラートアグリゲーションジョブ (サービスアナリティクスでの RCA/アラートアグリゲーションを使用したグループアラート):このジョブは毎分実行され、アラートパターン、CMDB 関係、およびテキストの類似性に基づいてアラートアグリゲーショングループを生成します。
    大規模な金融機関は、何千ものサーバーとアプリケーションからのアラートを管理する必要があります。機械学習アルゴリズムは、アラートデータのパターンを分析し、潜在的な侵害を示す一連のセキュリティアラートなど、関連するアラートを自動的にグループ化して、セキュリティチームが脅威に迅速に対処できるようにします。
    CMDB ベースのグループ化 アラートは、構成管理データベース (CMDB) の構成アイテム (CI) の関係と依存関係に基づいてグループ化されます。このアプローチにより、特定のインフラストラクチャコンポーネントまたはサービスに関連するアラートがグループ化されるようになり、コンテキストに応じたインシデント管理が提供されます。 通信会社は、CMDB データを使用して、ネットワークインフラストラクチャに関連するアラートを管理します。特定のネットワークルーターとその接続デバイスに関連するアラートは、CMDB の関係に基づいてグループ化されるため、ネットワークチームは関連するすべての問題を確認して、根本原因に効率的に対処できます。
    テキストベースのグループ化 アラートは、アラートのテキストコンテンツを分析して類似点と関連する問題を特定することでグループ化されます。自然言語処理 (NLP) 技術は、アラートの説明の共通点を見つけるためによく使用されており、この方法は非構造化データに効果的です。 IT サービスデスクは、さまざまな説明を含む大量のアラートを受信します。システムは自然言語処理を使用して、類似の問題 (データベース接続エラーやデータベースに接続できないなど) に言及するアラートをグループ化します。これは、IT チームが複数のサービスに影響を与える広範なデータベースの問題を特定するのに役立ちます。
    タグクラスターによるグループ化 アラートは、アプリケーション、サーバータイプ、地理的な場所などの一般的な属性を表すタグまたはラベルを使用して分類およびグループ化されます。この方法により、進化するタグ付け戦略に基づいて柔軟かつ動的なグループ化が可能になります。 組織は、グローバルな IT インフラストラクチャをより効果的に管理するために、地理的な地域別にアラートにタグを付けます。アイルランドにあるサーバーからのすべてのアラートは、場所タグを使用して自動的にグループ化されるため、IT チームは、特定のデータセンターに影響を与える停電などの地域の問題をすばやく確認して対応できます。
    手動でのグループ化 ユーザーは、システムの専門知識と理解に基づいて、関連するアラートを手動で選択してグループ化します。このアプローチでは、正確な制御が可能になりますが、時間がかかり、自動化された相関を見逃す可能性があります。 システムアドミニストレーターは、1 台のサーバー上の異なるサービスの障害に関する複数のアラートを受信します。アドミンは、これらのアラートを手動でグループ化し、すべてがそのサーバーの単一のハードウェア障害に関連していることを認識して、ハードウェアの問題の修正を優先させてすべてのサービスを復元します。
    手動およびルールベースのアラートのグループ化は、主に親アラートの選択方法において、アルゴリズムベースのグループ化とは異なります。手動、ルールベース、またはログアナリティクスによるグループ化では、実際のアラートの 1 つが親アラートとして指定されます。自動、CMDB、テキストベース、およびタグクラスターのモードでは、グループ内で最も古く、最も重大なアラートを表す仮想アラートが親アラートとして作成されます。
    注:
    ドメインセパレーションされた環境では、同じドメイン内のアラートに対してのみアラートグループが作成されます。

    スケジュール済みジョブとパラメーターの詳細については、「アラートのグループ化のスケジュール済みジョブとパラメーター」を参照してください。さまざまなグループ化のタイプの詳細については、「アラートのグループ化のタイプ」を参照してください。

    アラートのグループ化のメリット

    • 事前定義されたパターンに基づいてアラートをアグリゲートすることで、自動アラートグループを作成します。
    • タイムスタンプと CI 識別を使用してアラートを相関付け、自動アラートグループを形成します。
    • CMDB 内の CI の関係性に基づいてアラートを相関付けることで、CMDBベースのアラートグループ化を形成します。
    • NLP (自然言語処理) を使用して、アラートのテキストの類似性に基づいてアラートを相関付けます。
    • アラートグループにアラートを追加するパターンを生成し、それに応じて自動アラートグループを作成します。