イベント管理の詳細
イベント管理の詳細を確認して、その概要、プロセスフロー、ユーザーロール、および IT の問題の包括的なモニタリングと解決のメリットを理解します。
イベント管理は、IT 環境内のさまざまなコンポーネントを効果的に管理することで、IT の問題の包括的なモニタリング、分析、および修復を可能にします。こうしたコンポーネントには、検出サービス、アプリケーションサービス、ダイナミック CI グループ、アラートグループなどがあります。
- 検出サービス:検出サービスは、CMDB の相互に関連する構成アイテム (CI) によって定義され、サービスマッピングによって識別されます。検出サービスには、マッピング関係を伴うサービスマップ、機能停止の重大度を示す影響ツリー、アクティブなアラートと関連アラート、および CI プロパティが含まれています。このサービス情報は、ダッシュボード、アラートリスト、およびイベントリストに表示されます。
- アプリケーションサービス:特定の CI を選択して作成されるアプリケーションサービスにより、ターゲットを絞った監視と管理が可能になります。詳細については、アプリケーションサービスのドキュメントを参照してください。
- ダイナミック CI グループ:これは、場所などの共有クライテリアに基づいてグループ化された CI のコレクションです。ダイナミック CI グループは、アプリケーションサービスの設定に役立ち、管理を簡素化します。
- アラートグループ:アラートグループにより、アラートセットを編成してメンテナンスと管理を簡素化することで、IT の問題に効率よく容易に対応できるようになります。
プロセスフロー
イベント管理は、外部イベントを受信し、事前定義されたルールに基づいてアラートを生成します。MID サーバーは、外部イベント追跡ツールをポーリングし、保存および処理するデータをイベント管理に送信します。イベントはイベント [em_event] テーブルに保存され、アラートは一致するイベントルールによって作成されます。その後、アラートは変換されて追加のコンテンツで強化され、しきい値が満たされた場合に累積され、特定のフィールドにマッピングされます。システムでは、一致するメッセージキーを検索して既存のアラートを更新するか、新しいアラートを作成して、関連するイベントを単一のアラートの下に関連付けます。アラートは、根本原因分析に備えて特定の構成アイテム (CI) にバインドされます。詳細については、「イベント管理のプロセスフロー」を参照してください。
ユーザー
| ロールタイトル [name] | 説明 |
|---|---|
| アドミン [evt_mgmt_admin] |
イベント管理を設定するためのすべてのイベント管理機能に対して、読み取りまたは書き込みアクセス権があります。 注: evt_mgmt_admin ロールは admin ロールに昇格する可能性があるため、注意が必要です。evt_mgmt_adminロールを持つユーザーは、グローバルスコープで実行されるスクリプトを追加および変更できます。適切なアクセス制御を確実に行います。このロールでは、ユーザーは次のスクリプトを作成または更新できます。
|
| 演算子 [evt_mgmt_operator] |
アラートを管理します (アラートのクローズや確認を含む)。イベント管理プロセス全体を監督し、イベントが適切に分類され、優先順位が付けられ、解決のためにルーティングされるようにします。 |
| チームオペレーター [evt_team_operator] |
[アサイン先グループ] フィールドで定義されているように、特定のチーム内のイベント管理操作を管理します。このロールでは、オペレーターはアサインされたチーム専用のアラートを読み書きできます。さらに、オペレーターは、アラートの自動化や統合ランチパッドの更新など、チーム固有の構成変更を行うことができます。 注: evt_team_operator ロールをアサイン先グループにアサインして、そのグループのアラートを表示および管理する必要があります。ロールが作成されていても、アラートがアサインされているグループに関連付けられていない場合、オペレーターはアラートを表示できません。 |
| ユーザー [evt_mgmt_user] |
アラートのライフサイクルを管理します (アラートの表示や確認などの基本的な操作の実行を含む)。 |
メリット
- 迅速な問題検出:潜在的な IT の問題をすばやく特定して強調表示します。
- 効率的なアラート処理:アラートをアグリゲートして関連付け、管理を簡素化します。
- 自動アクション:自動修復プロセスを開始して、問題の解決を迅速化します。
- 包括的なモニタリング:複数のツールと統合して、システム全体の概要を把握します。
- 根本原因分析:問題の根底にある原因を特定するためのツールを提供します。
- カスタマイズ可能なルール:特定のニーズに合わせてイベントおよびアラートの管理ルールをカスタマイズします。
- ダウンタイムの短縮:迅速な問題解決により、システムのダウンタイムを最小限に抑えます。
- ヴィジビリティの向上:リアルタイムダッシュボードでシステムの健全性に関するインサイトを提供します。
- コスト効率:問題の長期化を防ぐことで運用コストを削減します。