Anomalieerkennungsalgorithmus
Instance Observer führt die Erkennung von Anomalien über das statistische Z-Punktzahl-Modell durch, andernfalls als univariate Methode bezeichnet.
Die Anomalieerkennung analysiert einen Satz von fünf Metriken: Arbeitsspeichermaximum, Semaphor-Mittelwert, SQL-Antwortzeit, Serverantwortzeit und Transaktionsanzahl. Das Erkennungsmodell wurde mit Stichproben mit mehreren Instanzen von Daten auf täglicher, wöchentlicher und monatlicher Ebene validiert.
Metriken, die Anomalien mithilfe des Z-Punktzahlmodells darstellen, sind Transaktionsanzahl, Serverantwortzeit und SQL-Antwortzeit. Metriken, die Anomalien anhand eines auf einem oberen Schwellenwert basierenden Ansatzes darstellen, sind Semaphor-Mittelwert, Knoten-maximaler Arbeitsspeicher und Auftragsausführung. Siehe Erste Schritte mit Leistungsdiagrammen Für Details zu den fünf Metriken.
Methode auf Basis des oberen Schwellenwerts
Bei der Methode auf Basis des oberen Schwellenwerts werden Metriken mit einem erschöpfenden Grenzwert verwendet. Beispiel: Metrik A, die einen Semaphor-Mittelwert von 14 oder 16 hat und auf der Plattform verwendet wird, um die Anzahl der Transaktionen zu begrenzen, die auf einem Knoten gleichzeitig auftreten können, um Ressourcen auf dem Knoten zu schützen. Metrik B, max. Arbeitsspeicher von 2 GB, wobei jeder Knotenspeicher über eine vordefinierte maximale Kapazität verfügt. In allen ähnlichen Fällen ist die Situation nur alarmierend, wenn die Metriken näher an der Erschöpfungsgrenze liegen. Selbst wenn die Abweichung höher als der Mittelwert, aber niedriger als die Ausschöpfungsgrenze ist, würde der Schwellenwert nicht zu einem Alarm führen.
Z-Punktzahl-Methode
Eine Z-Punktzahl ist eine numerische Messung, die die Beziehung zwischen einem Wert und dem Mittelwert einer Gruppe von Werten beschreibt. Die Z-Punktzahl wird als Standardabweichungen vom Mittelwert gemessen. Wenn eine Z-Punktzahl 0 ist, ist die Datenpunktzahl mit der mittleren Punktzahl identisch.
Die Formel für die Berechnung einer Z-Punktzahl lautet z = (x-μ)/σ :
- X : Die Rohpunktzahl der Daten als gleitender Durchschnitt der letzten 15 Minuten
- μ : Der Datenausfüllungsmittelwert, der der Durchschnitt der letzten vier Wochen am selben Tag, derselben Stunde und derselben Minute ist
- σ : Die Standardabweichung der Datenauffüllung
Die Zyklizitätspunktzahl ist die Ähnlichkeit zwischen zwei Serien, die die Ähnlichkeit zwischen zwei Vektoren messen und sicherstellen, dass das Z-Punktzahlmodell zuverlässige Einblicke bietet und echte Anomalien oder Ausreißer identifiziert, während die natürlichen Muster der Daten berücksichtigt werden.
Die zyklische Punktzahl wird auf Instanzebene mit einer Datenauswahl von vier Wochen berechnet, die in zweiwöchige Vektorschritte (ohne Wochenenden) aufgeteilt ist. Die Punktzahl gibt die Ähnlichkeitspunktzahl zwischen den beiden zurück, wobei eine höhere Punktzahl auf einen stärker ausgerichteten Ähnlichkeitstrend in den verglichenen Vektordaten hinweist.