イベント管理 構成設定
プロパティと全般的な構成の優先設定です。
既知のエラーポータルとコミュニティを利用すると、問題に関する情報を見つけやすくなります。
全般設定
- セルフ健全性
- デフォルトでは、セルフヘルスモニタリング機能は有効になっていません。有効にするには、 をクリックし、Enable Event Management self-health monitoring (evt_mgmt.self_health_active) プロパティで [はい] を選択します。この機能を使用すると、イベント管理 の多くの機能を監視および追跡できます。注:セルフ健全性サービスで使用される CI は、CMDB 内で作成されます。
イベントデータ連携
- SNMP トラップ
- デバイスから直接送信するのではなく、監視ツールを使用して SNMP トラップを送信します。
- イベントルールを書き直さなくてもよいようにするには、イベントルールを定義する前に MIB をアップロードします。
- Web サービス API
- データ連携用の Web サービス API を使用すると、必要なイベントルールの数を減らすことができます。このアクションにより、イベントを変換する必要がなくなります (準備されたデータはイベントでインスタンスに送信されます)。
- データ連携には、専用の認証情報を使用します。必要に応じて、各イベントソースに固有の認証情報を指定します。
- CloudWatch
- CloudWatch と ServiceNow のデータ連携には、専用の認証情報を使用します。
- メール
- ソースのボリュームが少なく、他のオプション (スクリプトの実行や SNMP トラップの転送など) が利用できない場合にのみ、メールを使用します。
- イベントルール
- イベントルールを作成するときの構成設定:
- 可能な限り広範囲のイベントに適用するイベントルールを記述します。その後、より詳細なルールを必要に応じて作成できますが、より小さい値を使用してください。
- より一般的なルールでも同じ結果が得られる場合は、特定のイベントサブセットにのみ適用されるイベントルールを記述することは避けてください。
- イベントルールがイベントに適用されるときに、元のイベントは変更されません。すべての処理はメモリー内で行われるため、トラブルシューティングには [処理のメモ] フィールドを使用するか、[イベントのプロセスのチェック] UI アクションリンクを使用してください。
- 既存のマッピングルールがあるルール/変換を変更する場合は、実際のイベントまたはシミュレートされたイベントを確認して再テストする必要があります。
- [送信元 (From)] フィールドの値が、イベントの additional_info フィールドの JSON の文字列と正確に一致することを確認します。この照合は、MIB ファイル内の情報に基づいてルールが設定されている場合に行われます。MIB ファイルがアップロードされていない場合、SNMP トラップ用の JSON では、MIB の変換後の名前ではなく、ドット形式の名前の付いた varbinds (変数バインド) を表示します。この場合、イベントフィールドマッピングルールは適用されません。
- 一貫性のある命名規則を確立します。一般的な命名規則は <customer acronym>.<Event Source>.<Description> です。たとえば、 ACME.OEM.Normalize
- 2 つのイベントルールに同様の条件が設定されている場合は、[順番] フィールドを使用して、実行するイベントルールを管理します。
- イベントルールを使用して、アラートを CI に関連付けます。
アラート設定
- アラートライフサイクル
- 一般的なアラート機能:
- イベントが無視されない場合、またはイベントルールがそのしきい値を超えている場合、アラートがオープンになり、重複排除ではイベントが既存のアラートに属するものとして識別されません。
- アラートがクローズされるのは、クローズイベントが同じメッセージキーで送信されたとき、またはアラートが手動でクローズされたときです。
- 同じメッセージキーを持つオープンアラートが、プロパティで定義された期間内 (デフォルトは 1 時間) に送信された場合は、アラートが再オープンされます。
- プロパティの定義に従ってアラートが高い頻度でオープン/クローズすると、フラッピングになります。このような頻度のオープン/クローズが停止すると、アラートはフラッピングステータスから脱します。
- インシデントがアラートからオープンされると、インシデントがオープンである限り、そのアラートはオープンのままになります。デフォルトでは、インシデントまたはアラートのいずれかがクローズされると、もう一方もクローズされます。この動作は、プロパティを使用して設定できます。
- 対応するインシデントの作成時にアラートをクローズしないでください。
- オープンアラートは削除しないでください。先にアラートをクローズしてから削除してください。
- [確認] を使用すると、アラートが既知であり、一時的に無視できることを示すことができます。
- アラートを要注意としてマークするために [確認] を使用するのはやめてください。
- 次のいずれかの状況でアラートを作成しないでください。
- クローズ済み
- OK
- オープン
evt_mgmt.alert_auto_close_intervalプロパティを設定すると、指定された期間の後にアラートが自動的にクローズされます。0 を指定しないでください。値 0 は機能を無効にするため、パフォーマンスの低下につながるおそれがあります。- [OK] ステータスのアラートを作成しないでください。モニタリングシステムによっては、[OK] が問題の解決を示す場合もあれば、運用上重要ではないイベントを示すために [OK] が使用される場合もあります。前者の場合は、マッピングルールを使用して [OK] ではなく [クリア] を使用してください。後者の場合は、イベントが特定の値でない限り、無視ルールを使用してください。
- アラートアクションルール
- スケジュール済みジョブは、11 秒ごとにアラートアクションルールを新規アラートに適用します。アラートルールがすぐに開始されない場合は、トラブルシューティングを開始する前に 10 ~ 15 秒間待ちます。
- 2 つのアラートルールに同様の条件が設定されている場合は、[順番] フィールドを使用して、実行するアラートルールを管理します。
- タスクテンプレートでアラートアクションルールを使用して、インシデントの静的な値を入力します。ポピュレータースクリプトを使用して、インシデントの動的な値を割り当てます。ポピュレータースクリプトは、インシデントの作成を中止する値として false を返すことができます。
- イベント管理 (または類似の名前) というユーザーを作成します。次に、タスクテンプレート ([インシデント] など) 内の [作成者] フィールドは、そのユーザーがタスクのソースであったことを示すように設定できます。
- 動的な値の割り当てを実行したり、OOB 動的値の割り当てを上書きしたりするには、EvtMgmtCustomIncidentPopulator スクリプトインクルードを使用します。
- 修正
- オーケストレーションワークフロープロパティを常に修復タスク [em_remediation_task] テーブルに設定します。
- ECC キューの使用と 修復アクティビティに関する詳細情報を検索します。
ビジネスルール
- アラートテーブルで作成されたビジネスルールにかかる時間は、数ミリ秒以内にする必要があります。ビジネスルールを使用する代わりに、ジョブを使用して同じ機能を実現できるかどうかを検討してください。
- ビジネスルールを使用して、アラートを CI に関連付けることはやめてください。ビジネスルールを使用せずにバインドするには、イベントルールを使用します。
計画
- フィルター、モジュールなどのイベントソース構成を順次ではなく複数の並列処理に編成します。
- 処理されたイベントフォーマットを検証し、解析データが望ましい結果になっていることを確認します。
- 非本番環境で本番イベントをテストします。非本番要素マネージャーおよび ServiceNow インスタンスとデータ連携します。非本番要素マネージャーが利用できない場合は、要素マネージャーから本番環境と非本番環境の両方にイベントを送信します。
サービスとダッシュボード
- サービスグループを使用してサービスを論理グループにグループ化すると、サービス健全性ダッシュボードに表示されるサービスの数を減らすことができます。
- 手動で作成されたサービスマップをインポートします。
メトリックインテリジェンス コレクターのログおよびファイル
メトリックインテリジェンス コレクターのログおよびファイルは、パス $(MID_SERVER_DIR)/agent の下にあります。トラブルシューティングおよび監視に、こうしたログとファイルを使用します。
| ログまたはファイル | パス |
|---|---|
| PowerShell メトリクスコレクターのログファイル | Logs/retrieve_metrics{connector instance ID}.log |
| PowerShell 出力ファイル | work/metrics/metrics_output_{connector instance ID}.txt |
| PowerShell 入力ファイル | work/metrics/parameters_{connector instance ID}.txt |
mid.log.level MID サーバー パラメーターがデバッグモードになっている場合は、MID サーバー のログファイルで メトリックインテリジェンス のパフォーマンスを確認できます。
メトリックインテリジェンス のパフォーマンス数値は、パフォーマンス統計情報 [sa_performance_statistics] テーブルで得られます。パフォーマンス数値を表示するには、[Metric Collector] のパフォーマンス統計情報リストをフィルタリングします。