
- RSS フィードを購読する
- 新着としてマーク
- 既読としてマーク
- ブックマーク
- 購読
- 印刷用ページ
- 不適切なコンテンツを報告
(本稿は、こちらのBlog記事の翻訳です)
多くの企業・組織において、サイトリライアビリティエンジニアリング (SRE) の実践が広がっています。これは、IT 部門内外でのデジタルトランスフォーメーション (DX) の一環として、従業員、顧客、パートナーへのアプリケーションサービスの提供が増加しているためです。同時に、DX 推進のスピードと各事業部門 (Lines of business、LOB) のニーズがコーポレート IT 部門 (訳註: 企業全体のIT戦略やシステムを統括し、各部門に共通のITサービスやガバナンスを提供する部門) の能力を上回っているため、LOB 側で自律的な実装が可能となるような支援の必要性が高まっています。なお、SRE がインシデント対応にどのように役立つかについて、こちらで詳しくご覧いただけます。
2024 年 8 月に一般提供が開始された新たなソリューションであるサービスリライアビリティ管理 (Service Reliability Management、SRM) を通じて、ServiceNow はアプリケーションサービスの信頼性、可用性、健全性を向上させるためのインシデント対応を支援しています。
SRE 主導のインシデント対応についてServiceNow がユーザーから収集した課題には、以下のようなものがあります。
-
SRE・DevOps・IT 運用・ネットワークチームが必要とする柔軟性が得られていない。これらのチームは、自らのビジネスロジックやデータに基づいて、自らが使用するシステムを構成する自律性・独立性を求めているが、コーポレート IT 部門は一定のガバナンスを維持したいと考える。
-
インシデント対応の基盤をセルフサービスで使いこなせるようにしたいと考える一方、そうした製品は直感的な UI やインターフェース、およびガイド付きセットアップ・ヘルプを備えていない。イベント管理の多種多様なモジュール、リスト、フォーム、アラートコネクタの設定、オンコールスケジュールの作成などが複雑すぎて使いにくいと受け止められている。
-
ServiceNow の CMDB やデータモデルに、サービスレベル目標 (Service level objective、SLO)、サービスレベル指標 (Service level indicator、SLI)、エラーバジェットといった SRE の核心的な概念が欠けている。 また、ServiceNow の IT Operations Management (ITOM) におけるアラート管理やヘルスマネジメント機能と、ITSM のオンコールや重大インシデント対応機能との連携が十分に統合されていない。
これらのデジタルサービスを展開する多くの組織では、「計画、構築、運用」という共通のプロセスが採用されています。SRE に特化すると、サービスのパフォーマンス目標の特定 (SLOの定義)、サービスの監視・ログ・トレースの実装、そして問題が検出された場合に備えてのオンコールのリソース確保に焦点が当てられます。
ServiceNow は現代の SRE プラクティスに沿った多くの機能を持っていますが、SRM アプリケーションはサービスの「運用」部分を支援することを目指しています。これは、ビジネスコンテキストに沿って SLO パフォーマンスを可視化するとともに、オンコールのアラートやインシデント対応を可能とします。SRE を導入中である、または既に実践している ServiceNow ユーザーにとって、SRM は SRE を活用してアプリケーションサービスの健全性を自律的に管理する術となります。また、SRM には各種ガイドが内蔵されており、セルフサービスで活用を推進できます。SRM の主要機能は、サービスオペレーションワークスペース (Service Operations Workspace) 内に統合されています。
下の図は、SRM アプリケーションの包括的なビジョンを表しています。
一方、2024 年 8 月時点では、SRM アプリケーションは以下の機能を有しています。
- 設定・ガバナンス管理のためのアドミンセンター
- チームベースのアクセス制御とその設定
- サービス登録
- SLI・SLO・エラーバジェットの設定
- サービス信頼性の概要
- アラート取込みとアプリケーションパフォーマンスモニタリングの統合
- アラート、インシデント、変更リスト
- サービスオペレーションワークスペース上における SRE ホームページ
- サービスオペレーションワークスペース上におけるオンコールとエスカレーションポリシーのガイド付きセットアップ
- アラートの自動化(グルーピング、エスカレーションと通知、エンリッチメント)
- 重大インシデント管理
また、今後、以下のような機能が追加される予定です。
- 生成 AI を活用した AIOps
- SLI・SLO 管理機能の強化(比率ベース、CI ロールアップ、障害サポート、SLO ダッシュボード、SLO テンプレート)
- ビルトインの可観測性コンテキスト
- ネイティブなシンセティックモニタリング
SRM アプリケーションは、旧来のエージェントワークスペース上で動作するストアアプリである Site Reliability Operations と Site Reliability Metrics を置き換えるものとなります。SRM アプリは、最新の UI であるサービスオペレーションワークスペース上に構築されています。
設定やアラートの取り込みから問題解決までの一連の流れを、こちらのクリックスルーデモ (英語UI) からご覧いただけます。キーボードの右矢印キーを使用して、画面を進めることができます。
© 2024 ServiceNow, Inc. All rights reserved. ServiceNow, ServiceNow のロゴ、Now、その他の ServiceNow マークは米国および/またはその他の国における ServiceNow, Inc.の商標または登録商標です。その他の会社名と製品名は、関連する各会社の商標である可能性があります。
- 546件の閲覧回数
ここにコメントを追加するには、ご登録いただく必要があります。 ご登録済みの場合は、ログインしてください。 ご登録がまだの場合は、ご登録後にログインしてください。