異常検出アルゴリズム

  • リリースバージョン: Zurich
  • 更新日 2025年07月31日
  • 所要時間:2分
  • Instance Observer は、Z スコア統計モデル (単変量法とも呼ばれます) を使用して異常検出を実行します。

    異常検出では 5 つのメトリクス (メモリ最大値 (Memory Max)、セマフォ平均 (Semaphore Mean)、SQL 応答時間、サーバーの応答時間、トランザクション数) を分析します。検出モデルは、日単位、週単位、および月単位のデータの複数インスタンスを含むサンプリングを使用して検証されています。

    Z スコアモデルを使用して異常を表すメトリクスは、トランザクション数、サーバーの応答時間、SQL 応答時間です。上限しきい値ベースのアプローチを使用して異常を表すメトリクスは、セマフォ平均 (Semaphore Mean)、ノードメモリ最大値 (Node Memory Max)、およびジョブ実行です。5 つのメトリクスの詳細については、「パフォーマンスチャートの開始」を参照してください。

    上限しきい値ベースの手法

    上限しきい値ベースの手法では、メトリクスと使用上限を使用します。たとえば、セマフォ平均値が 14 または 16 のメトリクス A は、ノード上のリソースを保護する目的でノードで一度に実行できるトランザクションの数を制限するために、プラットフォームで使用されます。最大メモリが 2 GB のメトリクス B の場合、各ノードメモリに対して最大容量が事前に定義されます。同様のすべてのケースにおいて、メトリクスがこのような使用上限に近づいた時点でのみアラームが発生します。逸脱が平均を超えていても、使用上限よりも低い場合には、しきい値上限によるアラームは発生しません。

    Z スコア手法

    Z スコアは、1 つの値と値グループ平均の間の関係を示す数値測定値です。Z スコアは、平均からの標準偏差として測定されます。Z スコアが 0 の場合、データポイントスコアは平均スコアと同じです。

    Z スコアの計算式は z = (x-μ)/σ です。

    • x:過去 15 分間の移動平均としてのデータの生スコア
    • μ:過去 4 週間の同じ曜日、同じ時間、同じ分における平均であるデータ母集団の平均
    • σ:データ母集団の標準偏差
    Z スコアの計算または比較を行うときは、分析データのこれらのパターンと、固有の周期パターンを併せて考慮することが不可欠です。データセットの周期性とは、日単位、週単位、季節単位の周期など、一定の間隔で発生する繰り返しパターンを指します。たとえば売上データは、ホリデーシーズン中に高い値を示し、オフピーク期間に低い値を示すことがあります。

    周期性スコアは 2 つの系列間の類似度であり、2 つのベクトル間の類似度を測定します。周期性スコアにより、Z スコアモデルが信頼できる分析情報を提供し、真の異常または外れ値を特定し、データの自然なパターンを反映するようになります。

    周期性スコアは、週末を除いた 4 週間分のデータを 2 週間分のベクトル増分に分割して、インスタンスレベルで算出されます。このスコアは 2 つの系列間の類似度スコアを返します。スコアが高いほど、比較対象のベクトルデータの類似傾向がより一致していることを示します。