Automatisierte Warnungsgruppierung

Freigeben Version: Yokohama

Aktualisiert 30. Januar 2025

2 Minuten Lesedauer

Die automatisierte Warnungsgruppierung ist ein Prozess, der Verlaufsdaten verwendet, um ähnliche Warnungen automatisch in Gruppen zu organisieren. Diese Warnungen können Systemprobleme wie Serverfehler oder Netzwerkausfälle sein. Durch die Gruppierung zugehöriger Warnungen können Teams Muster schnell erkennen, wiederkehrende Probleme verwalten und das Rauschen durch zu viele einzelne Warnungen reduzieren.

Stellen Sie sich vor, Sie überwachen das Verkehrssystem einer Stadt. Sie erhalten viele Warnungen, z. B. Berichte über Unfälle, Verkehrsstaus und Straßensperrungen. Die automatisierte Warnungsgruppierung funktioniert wie ein intelligenter Assistent, der diese Warnungen basierend auf Mustern organisiert, sodass Sie verwandte Probleme gemeinsam anzeigen und effizienter reagieren können. Diese automatisierten Warnmeldungsgruppen werden unter Express-Liste innerhalb von Service Operations-Arbeitsbereichangezeigt.

So aktivieren Sie diese Gruppierung

Um die auf maschinellem Lernen basierende Automatisierung für die Warnungskorrelation zu aktivieren, legen Sie die Eigenschaft ML-basierte Automatisierungskorrelation aktivieren (sa_analytics.specific_patterns_enabled) auf „wahr“ fest.

Wenn das Installationsprogramm für Domain Support – Domain Extensions aktiviert ist, werden Warnungszusammenfassungsmuster basierend auf der Domänenebene erstellt, die in der Eigenschaft „sa_analytics.agg.learner_domain_level“ definiert ist. Standardmäßig ist diese Domänenebene auf zwei festgelegt, was der zweiten Ebene in der Domänenhierarchie entspricht. Beispielsweise kann in einem Unternehmen Ebene 1 das Unternehmen selbst darstellen, während Ebene 2 Abteilungen oder Teams innerhalb des Unternehmens darstellen kann. Warnungen werden basierend auf dieser zweiten Ebene gruppiert, ähnlich wie nach Abteilung oder Team. Für weitere Details Domain Separation und Ereignismanagement.

Funktionsweise

Die automatisierte Warnungsgruppierung nutzt maschinelles Lernen (ML) und Verlaufsdaten, um Muster in Warnungen zu identifizieren. Er untersucht bestimmte Merkmale, die als Musterbezeichner bezeichnet werden, z. B. den Typ des Problems, das betroffene System, das CI oder die Metrik, die innerhalb eines ähnlichen Zeitraums mehrmals aufgetreten ist, um zu bestimmen, ob Warnungen zusammenhängen. Der Alert Aggregation Learninger verwendet Algorithmen, um Warnungen basierend auf Mustern zu gruppieren. Konkret werden musterbasierte Algorithmen und Wahrscheinlichkeitsmethoden verwendet, um eingehende Warnungen zu analysieren und zugehörige Warnungen zu identifizieren.

Stellen Sie sich das so vor, als würden Sie feststellen, dass an einer bestimmten Kreuzung häufig zu Hauptverkehrszeiten Unfälle passieren. Das System gruppiert ähnliche Warnungen (z. B. wiederkehrende Verkehrsstaus an derselben Stelle) basierend auf bestimmten Bezeichnern (z. B. Standort oder Typ des Problems). Das System führt die folgenden Schritte aus, um Warnungen effektiv zu gruppieren:

Verlaufsdaten analysieren: Das System untersucht vergangene Warnungen, um Muster und Beziehungen zu ermitteln.
Maschinelles Lernen anwenden: ML-Algorithmen analysieren historische Warnungsdaten, um Muster und Beziehungen zwischen Warnungen zu identifizieren. Das System kann aus vergangenen Incidents lernen und seine Fähigkeit verbessern, ähnliche Warnungen im Laufe der Zeit zu gruppieren.
Ähnliche Warnungen gruppieren: Warnungen mit übereinstimmenden Mustern werden automatisch in einer Gruppe zusammengefasst.

Angenommen, Sie verwalten das Verkehrssystem einer Stadt und erhalten mehrere Warnungen:

8:00 Uhr: Unfall auf der Hauptstraße
8:05 Uhr: Verkehrsstau in der Nähe der Main Street
8:10 Uhr: Straßensperrung auf der Main Street

Die automatisierte Warnungsgruppierung funktioniert wie ein intelligenter Assistent, indem sie diese Warnungen analysiert und ein Muster erkennt. Es gruppiert sie, da sie sich alle auf die Main Street beziehen und wahrscheinlich aus demselben Unfall stammen. Dadurch können Sie schnell das Gesamtbild erkennen und sich auf die Behebung der Ursache (des Unfalls) konzentrieren, anstatt jede Warnung einzeln zu behandeln.

Vorteile

Wiederkehrende Probleme finden: Erkennen Sie schnell Muster (z. B. ständige Überhitzung eines Servers).
Zeitersparnis: Behandeln Sie Gruppen zusammengehöriger Warnungen anstelle einzelner.
Antwort verbessern: Fokus auf die Behebung der Ursache anstatt die Behandlung vereinzelter Probleme.