Eita Cho
ServiceNow Employee
ServiceNow Employee

はじめに

 

データ、ワークフロー、及びAIを統合しているServiceNow AIプラットフォームは、企業様にとってますます重要な存在となり、中心的な役割を果たしています。それ故に、インスタンスの健全性をリアルタイムでモニタリングするのは不可欠です。一般的に提供しているImpact Instance Observerでは、インスタンスのCPUなどの使用率の可視化まではできますが、インスタンスの中に入って、アプリケーションや、設定、トランザクションなど様々な詳細レベルのモニタリングはできません。言い換えますと、ServiceNow Glideインスタンスに出続けているログまでモニタリングをしなければインスタンス全体の健全性を正しく把握することができません。

 

しかし、サードパーティの製品を別途構築や、贅沢なツールを使う予算もなく、敢えてログモニタリングをせずに、ユーザから使っているサービスについてのクレームが上がっているときに初めて気付くなど、リアクティブな対応でしかありませんでした。

 

そこで、August/2024リリースでは、ITOMヘルスログアナリティクス(HLA)をつかって、ServiceNowインスタンスのSyslogをリアルタイムかつ自動的にモニタリングする機能を提供しました。昨今、多くの御客様はこの機能を利用しはじめ、すでにインスタンスの安定運用のひとつすぐにビジネス効果がえられた事例が多々ありました。

 

導入事例

あるグローバルの企業様は、インスタンスのピック利用時に断続的なパフォーマンス低下を直面していました。しかしながら、その根本原因について従来の監視方法では特定できませんでした。HLAを使用したSyslogのモニタリングを利用した結果、設定の不正があったことが根本原因として特定できました。さらに、業務ワークフローのため、外部システムと連携しているAPI通信の障害をいち早く突き詰めて、対応策として代替手段へ切り替えることで、ユーザへの影響を最小限に留めることができました。

 

また、とあるサービスプロバイダーの企業様はServiceNowを使ってサービスを展開されていますが、

 

  • “Crash”、”Failed”、“Timeout”などのキーワードの入るログはないか、普段より急にスパイクしていないか
  • パラメータの設定ミス、あるいはコンフリクトしている設定はないか
  • ワークフロー実行中、外部システムとのAPI通信の不具合はないか
  • 実行ジョブはスタックしていないか
  • 追加開発したスクリプトのロジックは大丈夫か
  • ユーザとの通信手段であるメールの送受信は問題なく稼働しているか

 

というのは早期にチェックすることで、問題が発生する前に特定したいです。加えて、サービス提供側としては、アラートの発生のサービスとそのサービスを使っていらっしゃる顧客様をいち早く特定して、プロアクティブに通知及び報告しなければなりません。これらは、すべてITOM HLAで対応することができます。

 

導入ステップ

HLAを使ってのSyslogのモニタリングの導入は、至ってシンプリです。

 

まず、syslogテーブルからログを直接HLAにストリーミングするため、MIDサーバを必要としません(=インフラ投資はゼロ)。単純に、サービスオペレーション・ワークスペース(SOW)の統合ロンチパット(Integration Launchpad)で設定するだけです。非常に短い時間(おそらく1分もかからないずに)で済む作業です(=導入作業の工数はゼロ)。

 

そして、同画面の「ストリーミングステータス」ビューで、ログがインプットされ、HLAのMLエンジンに処理され、さらにITOM AIOpsへアラート生成まで各ステージの処理状況を確認することができます。

 

 

EitaCho_0-1756133544968.png

 

 

なお、最新のZurich&August/2025リリースでは、上記の設定自体も不要になります!つまり、HLAアプリをインスタンスにインストールするたけで、システムが自動的にSyslogからログをストリームし、ログの構造を自動的解析/パースを行います。システムアドミンのユーザエクスペリエンスをより向上しました!

 

ログは、「ログビューアー(Log Viewer)」にて確認できます。

 

 

EitaCho_1-1756133544977.png

 

また、HLAは、ログのパターンを学習/相関し、異常を自動的に発見し、即時にアラートします。「エクスプレス・リスト(Express List)」にてアラートが確認できます。

 

EitaCho_2-1756133544992.png

 

 

あとは、ほかのアラートと同じように対応することになります。その際、HLAからのアラートのメッセージ詳細は長い場合があり、ServiceNowを熟知しない限り、読解しにくいケースがあります。その上、原因や対策の調査も時間と労力を費やします。そこで、生成AIであるNow Assist for ITOM/AI Agentを活用すれば、迅速に原因特定、対策を取ることで、結果として、ユーザに影響出る前に異常検知をし、MTTR を短縮し、運用生産性を向上させます。

 

 

EitaCho_3-1756133545006.png

 

 

まとめ

ITOM HLAは、単なるログの収集ツールを超えた、プロアクティブなIT運用を実現する戦略的製品です。サーバや機器やシステム、クラウドから出力されるログについてのモニタリングに加え、今回御紹介しました、ServiceNowインスタンスにあるSyslogのデータを直接ストリーミングし、インテリジェントなログデータの抽出、異常検出、アラート強化を適用することで、HLAはユーザからエスカレートされる前に問題を検出し、解決時間を短縮し、サービス信頼性を向上させることを可能にします。パフォーマンスのボトルネックのトラブルシューティングやダウンタイムの防止いずれの場合でも、HLAは生のログデータを実行可能な洞察に変換し、卓越した運用 を推進します。また、追加のインフラ投資、工数のいらない導入ができるため、クイックに価値を実現します。

 

ServiceNow AIプラットフォームの利用拡大をされている今であるからこそ、HLAを活用したリアルタイムのモニタリングは必須の要件です。プラットフォーム全体の健全性が可視化され、管理可能で回復力のある状態を維持できます。単に何が起こっているかを見るだけでなく、次に何をすべきかを知ることができます。

 

その他参考資料

HLAを使ったSyslogモニタリングのビデオ(日本語字幕に切り替えてみられます)https://www.youtube.com/watch?v=WtSALP3WYqo