Algorithme de détection d’anomalies
Instance Observer détecte les anomalies à l’aide du modèle statistique de score Z, également appelé méthode univariée.
La détection d’anomalie analyse un ensemble de cinq mesures : mémoire max., moyenne du sémaphore, délai de réponse SQL, délai de réponse du serveur et nombre de transactions. Le modèle de détection a été validé avec des échantillonnages avec plusieurs instances de données quotidiennes, hebdomadaires et mensuelles.
Les mesures représentant les anomalies à l’aide du modèle Z-score sont le nombre de transactions, le délai de réponse du serveur et le délai de réponse SQL. Les mesures représentant les anomalies à l’aide d’une approche basée sur le seuil supérieur sont la moyenne du sémaphore, la mémoire maximale du nœud et l’exécution des tâches. Reportez-vous à la section Introduction aux graphiques de performances pour en savoir plus sur les cinq mesures.
Méthodologie basée sur le seuil supérieur
La méthodologie basée sur le seuil supérieur utilise des mesures avec une limite épuisante. Par exemple, la mesure A, qui a une valeur moyenne de sémaphore de 14 ou 16, qui est utilisée sur la plateforme pour limiter le nombre de transactions pouvant se produire sur un nœud à la fois afin de protéger les ressources sur le nœud. Mesure B, mémoire max. de 2 Go, où chaque mémoire de nœud a une capacité maximale prédéfinie. Dans tous ces cas similaires, la situation n’est alarmante que lorsque les mesures sont plus proches de la limite d’épuisement. Même si l’écart est supérieur à la moyenne, mais inférieur à la limite d’épuisement, la limite de seuil n’entraînera pas d’alarme.
Méthodologie de score Z
Un score Z est une mesure numérique qui décrit la relation entre une valeur et la moyenne d’un groupe de valeurs. Le score Z est mesuré en termes d’écarts-types par rapport à la moyenne. Si un score Z est de 0, le score des points de données est identique au score moyen.
La formule de calcul d’un score Z est z = (x-μ)/σ :
- x : score brut des données, comme moyenne mobile des 15 minutes précédentes
- μ : la population de données signifie la moyenne des quatre semaines précédentes le même jour, à la même heure et à la même minute
- σ : écart-type de remplissage des données
Le score de cyclicité est la similarité entre deux séries qui mesure la similarité entre deux vecteurs et permet de s’assurer que le modèle de score Z fournit des informations fiables et identifie les véritables anomalies ou valeurs aberrantes tout en tenant compte des modèles naturels des données.
Le score cyclique est calculé au niveau de l’instance avec une sélection de données de quatre semaines divisées en incréments vectoriels de deux semaines, à l’exclusion des week-ends. Le score renvoie le score de similarité entre les deux, où un score plus élevé indique une tendance de similarité plus alignée dans les données vectorielles comparées.