Regroupement automatisé d’alertes

  • Rversion finale: Zurich
  • Mis à jour 31 juil. 2025
  • 3 minutes de lecture
  • Le regroupement automatisé d’alertes est un processus qui utilise des données historiques pour organiser automatiquement des alertes similaires en groupes. Ces alertes peuvent être des problèmes système, tels que des erreurs de serveur ou des pannes de réseau. En regroupant les alertes connexes, les équipes peuvent rapidement identifier des modèles, gérer les problèmes récurrents et réduire le bruit causé par un trop grand nombre d’alertes individuelles.

    Imaginez que vous surveillez le système de circulation d’une ville. Vous recevez beaucoup d’alertes, comme des rapports d’accidents, d’embouteillages et de fermetures de routes. Le regroupement automatisé d’alertes fonctionne comme un assistant intelligent qui organise ces alertes en fonction de modèles, de sorte que vous pouvez voir les problèmes connexes ensemble et y répondre plus efficacement. Ces groupes d’alertes automatisées sont affichés dans le Liste expressEspace de travail pour l'exploitation des services.

    Comment activer ce regroupement

    Pour activer l’automatisation basée sur l’apprentissage machine pour la corrélation des alertes, définissez la propriété Activer la corrélation d’automatisation basée sur ML (sa_analytics.specific_patterns_enabled) sur vrai.

    Si le programme d’installation de Domain Support - Domain Extensions est activé, des modèles d’agrégation d’alertes sont créés en fonction du niveau de domaine défini dans la propriété sa_analytics.agg.learner_domain_level. Par défaut, ce niveau de domaine est défini sur deux, ce qui correspond au deuxième niveau de la hiérarchie de domaine. Par exemple, dans une société, le niveau 1 peut représenter l’entreprise elle-même, tandis que le niveau 2 peut représenter les départements ou les équipes de l’entreprise. Les alertes sont regroupées en fonction de ce deuxième niveau, par exemple, en les triant par département ou par équipe. Pour en savoir plus, Séparation de domaine et Gestion des événements.

    Comment ça marche

    Le regroupement automatisé d’alertes utilise l’apprentissage machine (ML) et les données historiques pour identifier des schémas parmi les alertes. Il examine des caractéristiques spécifiques, appelées identificateurs de modèle, telles que le type de problème, le système affecté, le CI ou la mesure qui s’est produit plusieurs fois au cours d’une même période, afin de déterminer si les alertes sont liées. L’apprenant d’agrégation d’alertes utilise des algorithmes pour regrouper les alertes en fonction de modèles. Plus précisément, il utilise des algorithmes basés sur des modèles et des méthodes probabilistes pour analyser les alertes entrantes et identifier celles qui sont associées.

    Pensez-y comme si vous remarquiez que des accidents se produisent souvent à une intersection particulière aux heures de pointe. Le système regroupe des alertes similaires (comme les embouteillages récurrents au même endroit) en fonction de certains identificateurs (comme l’emplacement ou le type de problème). Le système suit les étapes clés suivantes pour regrouper efficacement les alertes :
    • Analyser les données historiques : le système étudie les alertes passées pour apprendre les schémas et les relations.
    • Appliquer l’apprentissage machine : les algorithmes d’apprentissage machine analysent les données d’alerte historiques pour identifier des modèles et des relations entre les alertes. Elle permet au système de tirer les leçons des incidents passés et d’améliorer sa capacité à regrouper des alertes similaires au fil du temps.
    • Regrouper les alertes similaires : les alertes avec des schémas correspondants sont automatiquement regroupées.
    Imaginez que vous gérez le système de circulation d’une ville et que vous recevez plusieurs alertes :
    • 8h00 : Accident sur Main Street
    • 8 h 05 : Embouteillage près de la rue Main
    • 8 h 10 : Fermeture de la rue Main
    Le regroupement automatisé d’alertes fonctionne comme un assistant intelligent en analysant ces alertes et en reconnaissant un modèle. Il les regroupe parce qu’ils sont tous liés à Main Street, probablement issus du même accident. Cela vous aide à avoir une vue d’ensemble rapidement et à vous concentrer sur la résolution de la cause première (l’accident), plutôt que de traiter chaque alerte séparément.

    Avantages

    • Trouvez des problèmes récurrents : repérez rapidement les modèles (comme un serveur qui surchauffe constamment).
    • Gagnez du temps : traitez des groupes d’alertes connexes plutôt que des alertes individuelles.
    • Améliorer la réponse : Concentrez-vous sur la résolution de la cause profonde plutôt que sur le traitement des problèmes épars.