ITOMサービスオペレーションワークスペースのアラート自動化

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:4分
  • アラートの自動化は、組織が増加するアラート数と複雑な IT インフラストラクチャに対処する上で非常に重要です。手作業によるアラート処理は時間がかかり、エラーが発生しやすく非効率的であるため、自動化されたシステムの必要性が高まっています。自動化により、アラートの平均解決時間が短縮され、サービスの信頼性が向上し、スタッフリソースをより適切にスケールできます。

    アラートの自動化は、一元化されたアドミニストレーターロールと分散されたチームロールの両方もサポートしています。これにより、認定されたチームはセルフサービスで独自のアラート自動化を作成できます。たとえば、サイト信頼性エンジニア (SRE) へのアクセスの許可を検討できます。チームのメンバーは、他のチームに影響を与えることなく、自分のチームと自分のアラートの自動化を管理できます。

    クラシックエクスペリエンスに慣れているユーザーのために、アラートの自動化では、分かりやすいユーザーインターフェイスが提供され、イベントルール、タグベースのクラスタリング定義、アラート管理ルールに対するチームサポートが強化されます。現在、一部の高度な機能は、クラシックエクスペリエンスでアドミンのみが利用できます。これら 2 つのエクスペリエンスでは、同じバックエンドテーブルが使用されます。どちらのエクスペリエンスでも使い勝手の良い方を使用でき、一方を変更するともう一方も更新されます。

    図 : 1. [アラートの自動化 (Alert automation)] ページ
    拡張、グループ化、またはエスカレーションして通知する自動化を作成するオプションがある [アラートの自動化] ページ。

    アラートの自動化のタイプ

    現在、サービスオペレーションワークスペース ITOM では次のタイプの自動化を提供しています。

    1. 無視の自動化:無関係なアラートや誤検出のアラートを減らし、ノイズの多い通知をフィルタリングしてアラートによる疲弊を効率的に管理し、チームが重要な問題に集中できるようにします。
    2. 拡張の自動化:生のアラートをコンテキスト情報で強化し、より有益で実用的なものにします。簡単に言うと、モニタリングツールによって生成された生のイベントを取得し、それらを共通の標準形式に変換して、自動化されたグループ化と応答を支援します。
    3. グループ化の自動化:複数の関連するアラートを単一のプライマリアラートにグループ化して、アラートのノイズを減らし、根本原因を特定します。
    4. 応答の自動化:適切なステークホルダーに通知してアラートに自動的に応答したり、必要に応じてエスカレーションしたり、修復アクションを実行したりします。重大度またはタイプに基づいて、アラートをエスカレートする方法とタイミングを決定します。サードパーティシステムと統合して、ケース、通知の作成、または修復アクションの実行を行います。

    アラート自動化のプロセスフロー

    まず、統合ランチパッドを使用して、モニタリングシステムから ServiceNow にアラートまたはイベントを送信します。アドミニストレーターはここで、ServiceNow とモニタリングツール間の接続を確立します。これらの統合により、監視対象データの収集が可能になり、サードパーティソースからイベントを生成できます。

    ServiceNow がアラートを受信すると、ページに表示される順序でアラートの自動化が実行されます。まず、ノイズを減らすためにアラートを無視します。次に、追加のコンテキストでアラートを拡張し、追加されたコンテキストを使用してアラートをグループ化します。最後に、修復をエスカレーションまたは実行することでアラートに対応します。タイプごとに自動化が複数存在する場合があります。各自動化は特定のトリガー条件に基づいて実行され、特定のアクションを実行します。アラートは、受信時にのみ自動化されます。過去のアラートには自動化は適用されません。

    アラートの拡張フェーズでは、アドミニストレーターはアラートに対する必要なフィールドの追加または抽出を行って、迅速な解決に不可欠な情報を提供します。これにより、効果的なインシデントレスポンスに必要な関連するすべての詳細がアラートに含まれるようになります。アドミニストレーターは、アラートを変更および正規化することで、アラートにコンテキストを追加します。これにより、アラートの相関関係が強化され、パターンと潜在的な脅威の特定が容易になります。

    その後、拡張および作成されたアラートは、事前定義されたクライテリアに基づいてグループ化され、関連するアラートが統合されます。これにより、アラートによる疲弊が軽減され、効率的な修復が促進されます。最後に、エスカレーションされたアラートは、さまざまなチャネルを通じてステークホルダーへの通知をトリガーして、重要なアラートへのタイムリーなコミュニケーションと応答が確実に行われるようにします。

    次の図は、このプロセスフローを示しています。
    図 : 2. アラートの自動化:ノイズの低減と解決時間の短縮
    アラートの自動化によりノイズを低減し、解決時間を短縮する方法を示す図。

    この包括的なアラート自動化プロセスにより、アラートのノイズを低減し、平均解決時間 (MTTR) を短縮して、サービスの信頼性を高め、スタッフの生産性を向上させることができます。