Algorithmus zur Erkennung von Anomalien

  • Freigeben Version: Xanadu
  • Aktualisiert 1. August 2024
  • 2 Minuten Lesedauer
  • Instance Observer führt die Erkennung von Anomalien über das statistische Modell mit Z-Punktzahl durch, auch als univvariate Methode bezeichnet.

    Die Anomalie-Erkennung analysiert einen Satz von fünf Metriken: „Maximaler Arbeitsspeicher“, „Semaphor-Mittelwert“, „SQL-Antwortzeit“, „Server-Antwortzeit“ und „Transaktionsanzahl“. Das Erkennungsmodell wurde durch Stichproben mit mehreren Instanzen von Daten auf täglicher, wöchentlicher und monatlicher Ebene validiert.

    Metriken, die Anomalien mit dem Z-Punktzahl-Modell darstellen, sind Transaktionsanzahl, Serverantwortzeit und SQL-Antwortzeit. Metriken, die Anomalien mithilfe eines auf dem oberen Schwellenwert basierenden Ansatzes darstellen, sind „Semaphor-Mittelwert“, „Knoten max. Arbeitsspeicher“ und „Auftragsausführung“. Weitere Informationen zu den fünf Metriken finden Sie unter Erste Schritte mit Leistungsdiagrammen.

    Auf oberen Schwellenwert basierende Methode

    Die auf dem oberen Schwellenwert basierende Methode verwendet Metriken mit einer ausschöpfenden Grenze. Beispiel: Metrik A mit einem Semaphor-Durchschnittswert von 14 oder 16, der auf der Plattform verwendet wird, um die Anzahl der Transaktionen zu begrenzen, die gleichzeitig auf einem Knoten auftreten können, um Ressourcen auf dem Knoten zu schützen. Metrik B, Arbeitsspeicher max. 2 GB, wobei jeder Knotenspeicher eine vordefinierte maximale Kapazität hat. In all diesen ähnlichen Fällen ist die Situation nur dann gefährlich, wenn die Metriken sich der Erschöpfungsgrenze nähern. Selbst wenn die Abweichung höher als der Mittelwert, aber niedriger als der Ausschöpfungsgrenzwert ist, führt der Schwellenwert nicht zu einem Alarm.

    Z-Punktzahl-Methodik

    Eine Z-Punktzahl ist ein numerisches Maß, das die Beziehung zwischen einem Wert und dem Mittelwert einer Gruppe von Werten beschreibt. Die Z-Punktzahl wird in Standardabweichungen vom Mittelwert gemessen. Wenn die Z-Punktzahl 0 ist, ist die Datenpunktpunktzahl identisch mit der mittleren Punktzahl.

    Die Formel zur Berechnung einer Z- Punktzahllautet:

    • x : Die Rohpunktzahl der Daten als gleitender Durchschnitt der letzten 15 Minuten
    • Mikrocomputer: Der Mittelwert der Datenauffüllung. Dies ist der Durchschnitt der letzten vier Wochen am selben Tag, zur selben Uhrzeit und zur selben Minute
    • : Die Standardabweichung derDatenauffüllung
    Bei der Berechnung von Z-Punktzahlen oder bei Vergleichen müssen diese Muster der analysierten Daten mit inhärenten zyklischen Mustern berücksichtigt werden. Zyklizität in einem Datensatz bezieht sich auf sich wiederholende Muster, die in regelmäßigen Abständen auftreten, z. B. in täglichen, wöchentlichen oder saisonalen Zyklen. Beispielsweise können Vertriebsdaten während der Urlaubszeiten höhere Werte und außerhalb der Spitzenzeiten niedrigere Werte aufweisen.

    Die Zyklizitätspunktzahl ist die Ähnlichkeit zwischen zwei Serien, die die Ähnlichkeit zwischen zwei Vektoren messen. Sie trägt dazu bei, dass das Z-Punktzahl-Modell zuverlässige Einblicke liefert und echte Anomalien oder Ausreißer identifiziert, während die natürlichen Muster der Daten berücksichtigt werden.

    Die zyklische Punktzahl wird auf Instanzebene mit einer Datenauswahl von vier Wochen berechnet, die in zweiwöchige Vektorschritte unterteilt sind, ohne Wochenenden. Die Punktzahl gibt die Ähnlichkeitspunktzahl zwischen den beiden zurück, wobei eine höhere Punktzahl auf einen ausgerichteteren Ähnlichkeitstrend in den verglichenen Vektordaten hinweist.