Ursachenkorrelation

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 1 Minute Lesedauer
  • Root Ursachenkorrelation (RCC) optimiert die Durchführung einer Ursachenanalyse durch die automatische Korrelation von Metriken, Protokollen und Ereignisinformationen für unterstützte Symptome in Produktionsinstanzen für die letzten 24 Stunden.

    RCC-Symptomkategorien

    Die Funktion „RCC“ ist für Selfservice-Warnungen verfügbar und unterstützt die folgenden Symptomkategorien:
    • Arbeitsspeicher
    • Sitzungen mit der längsten Ausführungszeit
    • Langsame Transaktionen
    • Cacheleerung
    • Datenbanksperren
    • Auswirkungen auf die Datenbank
    In der Tabelle werden die Symptomkategorien und die entsprechenden Warnungen beschrieben, die von der RCC-Engine erkannt werden.
    Tabelle : 1. Kategorien der gezielten Symptome und entsprechenden Warnungen
    Kategorien von Symptomen Beschreibung Entsprechende Warnung
    DB-Auswirkung Hilft dem Anwender, erweiterte SQL-Abfragen zu identifizieren und zu beheben, die sich auf die Datenbankleistung auswirken und zu einer hohen Ausführungszeit oder einem erhöhten Volumen führen. Die Abfragemuster ergeben Snapshots mit einer Dauer von 30 Minuten und 60 Minuten ab dem Zeitpunkt, ab dem die Auswirkung auf die Abfrageausführungszeiten beobachtet wird.​ Antwortzeit der Datenbank​
    Cacheleerung​ Cacheleerungen und Knotenneustarts werden ebenso erkannt wie hohe Servicesättigungsgrade, die möglicherweise ungefähr zum Zeitpunkt der Auslösung einer Leistungswarnung aufgetreten sind.​ Standard-Semaphor-Mittelwert​
    Sitzung mit der längsten Ausführungszeit​ Sucht nach den Top-Sitzungen mit langer Ausführungszeit in MTTR-Protokollen (Mean Time To Recovery) und identifiziert den Top-Transaktionsmuster-Hash mit den höchsten Verarbeitungszeiten und dann die Transaktions-IDs.​ Standard-Semaphor-Mittelwert​
    Langsame Transaktionen ​
    • Identifiziert die Top-Transaktionen mit langer Laufzeit anhand der Gesamtdauer, einschließlich ACL-Zeit, SQL-Zeit, CPU-Zeit, Verarbeitungszeit, BR-Zeit und Skriptzeit.
    • Gibt die Transaktions-IDs, den Muster-Hash und diese Metriken zurück, damit Anwender die spezifischen Ursachen für Transaktionen mit langer Laufzeit identifizieren können.
    Standard-Semaphor-Mittelwert​​
    Arbeitsspeicher​
    • Ermittelt die drei Knoten, die am stärksten von den Unterbrechungen der Garbage Collection betroffen sind, bestimmt durch die Gesamtdauer der Unterbrechungen.
    • Identifiziert alle Transaktionen oder Worker-Threads auf diesen Knoten, die 200 Sekunden überschreiten.
      Hinweis:
      Benutzern wird empfohlen, diese lang laufenden oder häufig wiederkehrenden Threads zu überprüfen.​
    Garbage Collection-Zeit des Knotens ​
    DB-Sperren​ Die RCC-Engine überwacht innodb_row_lock_waits und threads_running, um anomale Datenbanksperrenereignisse zu erkennen, die auftreten, wenn ein Datenbankvorgang ausschließlichen Zugriff erfordert. Ausgeführte Threads ​

    RCC-Berichtsstatus

    Wenn ein RCC-Bericht generiert wird, sind mehrere Status verfügbar:
    • RCC In Bearbeitung: Der RCC-Bericht wird generiert
    • RCC generiert: Der Bericht wurde erfolgreich generiert
    • Kein RCC gefunden: Wenn nicht genügend Informationen zum Generieren des Berichts vorhanden sind
    • RCC fehlgeschlagen: Wird zurückgegeben, wenn ein technisches Problem vorliegt. Wird in der Regel durch eine erneute Generierung des Berichts behoben