Anomalieerkennungsalgorithmus

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 2 Minuten Lesedauer
  • Instance Observer führt die Erkennung von Anomalien über das statistische Z-Punktzahl-Modell durch, andernfalls als univariate Methode bezeichnet.

    Die Anomalieerkennung analysiert einen Satz von fünf Metriken: Arbeitsspeichermaximum, Semaphor-Mittelwert, SQL-Antwortzeit, Serverantwortzeit und Transaktionsanzahl. Das Erkennungsmodell wurde mit Stichproben mit mehreren Instanzen von Daten auf täglicher, wöchentlicher und monatlicher Ebene validiert.

    Metriken, die Anomalien mithilfe des Z-Punktzahlmodells darstellen, sind Transaktionsanzahl, Serverantwortzeit und SQL-Antwortzeit. Metriken, die Anomalien anhand eines auf einem oberen Schwellenwert basierenden Ansatzes darstellen, sind Semaphor-Mittelwert, Knoten-maximaler Arbeitsspeicher und Auftragsausführung. Siehe Erste Schritte mit Leistungsdiagrammen Für Details zu den fünf Metriken.

    Methode auf Basis des oberen Schwellenwerts

    Bei der Methode auf Basis des oberen Schwellenwerts werden Metriken mit einem erschöpfenden Grenzwert verwendet. Beispiel: Metrik A, die einen Semaphor-Mittelwert von 14 oder 16 hat und auf der Plattform verwendet wird, um die Anzahl der Transaktionen zu begrenzen, die auf einem Knoten gleichzeitig auftreten können, um Ressourcen auf dem Knoten zu schützen. Metrik B, max. Arbeitsspeicher von 2 GB, wobei jeder Knotenspeicher über eine vordefinierte maximale Kapazität verfügt. In allen ähnlichen Fällen ist die Situation nur alarmierend, wenn die Metriken näher an der Erschöpfungsgrenze liegen. Selbst wenn die Abweichung höher als der Mittelwert, aber niedriger als die Ausschöpfungsgrenze ist, würde der Schwellenwert nicht zu einem Alarm führen.

    Z-Punktzahl-Methode

    Eine Z-Punktzahl ist eine numerische Messung, die die Beziehung zwischen einem Wert und dem Mittelwert einer Gruppe von Werten beschreibt. Die Z-Punktzahl wird als Standardabweichungen vom Mittelwert gemessen. Wenn eine Z-Punktzahl 0 ist, ist die Datenpunktzahl mit der mittleren Punktzahl identisch.

    Die Formel für die Berechnung einer Z-Punktzahl lautet z = (x-μ)/σ :

    • X : Die Rohpunktzahl der Daten als gleitender Durchschnitt der letzten 15 Minuten
    • μ : Der Datenausfüllungsmittelwert, der der Durchschnitt der letzten vier Wochen am selben Tag, derselben Stunde und derselben Minute ist
    • σ : Die Standardabweichung der Datenauffüllung
    Bei der Berechnung von Z-Punktzahlen oder bei Vergleichen ist es wichtig, diese Muster der analysierten Daten mit inhärenten zyklischen Mustern zu berücksichtigen. Zyklizität in einem Datensatz bezieht sich auf sich wiederholende Muster, die in regelmäßigen Intervallen auftreten, z. B. tägliche, wöchentliche oder saisonale Zyklen. Beispielsweise können Vertriebsdaten während der Feiertage höhere Werte oder niedrigere Werte außerhalb der Spitzenzeiten aufweisen.

    Die Zyklizitätspunktzahl ist die Ähnlichkeit zwischen zwei Serien, die die Ähnlichkeit zwischen zwei Vektoren messen und sicherstellen, dass das Z-Punktzahlmodell zuverlässige Einblicke bietet und echte Anomalien oder Ausreißer identifiziert, während die natürlichen Muster der Daten berücksichtigt werden.

    Die zyklische Punktzahl wird auf Instanzebene mit einer Datenauswahl von vier Wochen berechnet, die in zweiwöchige Vektorschritte (ohne Wochenenden) aufgeteilt ist. Die Punktzahl gibt die Ähnlichkeitspunktzahl zwischen den beiden zurück, wobei eine höhere Punktzahl auf einen stärker ausgerichteten Ähnlichkeitstrend in den verglichenen Vektordaten hinweist.