Schwellenwertwarnungen für MID-Serverressource

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 7 Minuten Lesedauer
  • Die Instanz zeigt Warnungen an, wenn ein MID-Server seine Ressourcenschwellenwerte für die CPU- und JVM-Arbeitsspeichernutzung verletzt, sodass Anwender E-Mail-Benachrichtigungen oder anwenderdefinierte Skripts erstellen können, wenn ein Verstoß auftritt.

    Die Tabelle „MID-Serverproblem“ [ecc_Agent_issue] warnt Anwender, wenn ein MID-Server die konfigurierten Schwellenwerte seiner zugewiesenen CPU- und Arbeitsspeicherressourcen überschreitet. Diese Warnungen werden veröffentlicht, bevor auf dem MID-Server eine Verschlechterung der Leistung oder ein Fehler mit zu wenig Arbeitsspeicher auftritt, sodass der Administrator Ressourcen erhöhen und Ausfallzeiten vermeiden kann. Administratoren können ein registriertes Ereignis verwenden, um E-Mail-Benachrichtigungen an ausgewählte Empfänger zu senden und sie über Schwellenwertverletzungen zu informieren oder ein anwenderdefiniertes Skript zu erstellen, um eine andere Art von Arbeit auszuführen. Die Instanz aktualisiert die Tabelle „MID-Serverproblem“ [ecc_Agent_issue] weiterhin, um ungelöste Probleme aktuell zu halten.

    Standardmäßig sind CPU- und Arbeitsspeicherschwellenwertwarnungen deaktiviert, und in der Tabelle „MID-Serverproblem“ [ecc_Agent_issue] werden keine Warnungen veröffentlicht. Um beide Arten von Warnungen zu aktivieren, fügen Sie diese Eigenschaften der Tabelle „Systemeigenschaft“ [sys_properties] hinzu, und legen Sie ihre Werte dann auf fest Wahr :
    • mid.threshold.resource.breach.enable.cpu.alerts
    • mid.threshold.resource.breach.enable.memory.alerts
    Details zum Hinzufügen von Systemeigenschaften zur Plattform finden Sie unter Fügen Sie eine Eigenschaft mithilfe von „sys_properties.list“ hinzu .

    Bewertungsprozess

    Diese Verarbeitung erfolgt unabhängig davon, ob Warnungen aktiviert sind oder nicht:
    1. Alle 10 Minuten überträgt jeder MID-Server seine CPU- und Arbeitsspeicherverbrauchsmetriken an die Instanz. Die Instanz fügt CPU-Metriken in ein Durchschnittliche CPU-Auslastung % Feld der Tabelle „ECC-Agenten-Skalarmetriken“ [ecc_agent_scalar_metric] und Arbeitsspeichermetriken in Max. Verwendeter Arbeitsspeicher % Feld der Tabelle „ECC-Mitarbeiterspeichermetriken [ecc_agent_memory_metric]“.
    2. Nach einem erfolgreichen Einfügen werden die folgenden Business-Regeln für jede Tabelle ausgeführt, wodurch eine Skripteinbindung aufgerufen wird, die eine entsprechende Funktion aufruft. Jede Funktion verwendet einen Durchschnitt der Metriksätze, die in die Tabellen eingefügt werden, basierend auf den konfigurierten Stichprobenintervallen.
      • Aktualisieren Sie den cpu-Mittelwert für den MID-Serverstatus : Ruft auf MIDResourceThresholdBreach.checkCpuUsage() Skripteinbindung.
      • Aktualisieren Sie den maximalen Arbeitsspeicher für den MID-Serverstatus : Ruft auf MIDResourceThresholdBreach.checkMemoryUsage Skripteinbindung.
      Jede Funktion verwendet einen Durchschnitt der Metriksätze, die in die Tabellen eingefügt werden, basierend auf den konfigurierten Schwellenwerten und Stichprobenintervallen. Die Instanz untersucht zuerst jeden MID-Server nach Konfigurationsparametern, die anwenderdefinierte Schwellenwerte oder Stichprobenintervalle für diesen MID-Server festlegen. Wenn keine Konfigurationsparameter für diese Attribute gefunden werden, sucht die Instanz in der Tabelle „Systemeigenschaften“ [sys_properties] nach anwenderdefinierten Werten, die verwendet werden sollen. Wenn keine Eigenschaften gefunden werden, verwendet die Instanz die Standardschwellenwert- und Intervallwerte aus dem Code.
      Hinweis:
      Sowohl die Schwellenwertprozentsätze als auch die Stichprobenintervalle sind konfigurierbar. Details siehe Konfigurieren von Schwellenwerten und Stichprobenintervallen.

    Warnungsprozess

    Wenn Warnungen für CPU- oder Arbeitsspeicherschwellenwerte aktiviert sind, erfolgt diese Verarbeitung:
    1. Wenn der aggregierte durchschnittliche Metrikwert dem konfigurierten Prozentwert entspricht oder überschreitet, löst die Instanz aus mid.threshold.resource.breachEreignis. Administratoren können dieses Ereignis zum Erstellen verwenden E-Mail-Benachrichtigungen Für Warnungen bei Schwellenwertverletzungen oder zum Erstellen eines anwenderdefinierten Skripts.
    2. Die Instanz fügt einen Datensatz des Verstoßes mit in die Tabelle „MID-Serverproblem“ [ecc_Agent_issue] ein Status Wert von Neu Und A Anzahl Von 1 und veröffentlicht dann eine Nachricht, die alle relevanten Details des Verstoßes enthält. Ein Beispiel für diese Nachricht ist Die durchschnittliche CPU-Auslastung in % hat den Schwellenwert (96>=91) für eine Intervallspanne von 40 Minuten überschritten, die nach dem Startdatum 2017-01-11 14:25:19 auftritt . Diese Nachricht wird in angezeigt Kurzbeschreibung Feld des Formulars „MID-Serverproblem“ und im Ereignis. Sie können jeden Teil der Nachricht in Ihre E-Mail-Benachrichtigungen kopieren.

    status des MID-Server-Problems

    Wenn der Administrator zuerst ein Problem in der Tabelle „MID-Serverproblem“ [ecc_Agent_issue] untersucht, kann der Administrator ändern Status Des Problems bis Bestätigt Gibt an, dass das Problem behoben wird. Jedes Mal, wenn die Instanz einen Verstoß erkennt, versucht sie, den Verstoß mit einem vorhandenen Problem abzugleichen. Wenn ein MID-Server bereits über einen Problemdatensatz für diesen Verstoß in verfügt Status Von Neu Oder Bestätigt , Die Instanz aktualisiert Zuletzt Erkannt Feld mit dem aktuellen Datum/der aktuellen Uhrzeit und erhöht den Anzahl Feld im vorhandenen Datensatz. Dadurch wird die Erstellung doppelter Datensätze in der Tabelle „MID-Serverproblem“ [ecc_Agent_issue] verhindert, und es wird aufgezeichnet, wie oft der Verstoß nach dem ersten Incident erneut aufgetreten ist. Der Administrator kann die MID-Serverressourcen schrittweise erhöhen und die Auswirkungen auf beobachten Anzahl Feld. Wenn der Zähler nicht mehr erhöht wird, weiß der Administrator, dass der MID-Server über ausreichende Ressourcen verfügt. Wenn die MID-Serverressource entsprechend angepasst wurde, legt der Administrator fest Status Bis Gelöst . Wenn eine neue Schwellenwertverletzung protokolliert wird, die einem MID-Serverproblem mit entspricht Status Von Gelöst , Die Instanz erstellt einen neuen Problemdatensatz.
    Hinweis:
    Jeder Datensatz in der Tabelle „MID-Serverproblem“ [ecc_Agent_issue], der seit 30 Tagen nicht aktualisiert wurde, wird unabhängig von seinem Status gelöscht.

    Empfehlungen zur Lösung von Ressourcenproblemen

    Administratoren haben die Möglichkeit, Ressourcenprobleme mit einem MID-Server zu beheben, wenn sie eine Benachrichtigung über das Ereignis erhalten. Befolgen Sie diese Empfehlungen, um die Belastung der MID-Serverressourcen zu reduzieren:
    • JVM-Arbeitsspeicher :
      • Weisen Sie dem MID-Server mehr maximalen Arbeitsspeicher zu. Weitere Informationen finden Sie unter Legen Sie die Größe des MID-Server-JVM-Arbeitsspeichers fest.
      • Fügen Sie zusätzliche MID-Server hinzu, um die Arbeitsauslastung freizugeben. Weitere Informationen finden Sie unter MID-Server-Cluster.
      • Reduzieren Sie den Umfang der gleichzeitigen Verarbeitung für den MID-Server. Dies umfasst die Segmentierung von IP-Adressbereichen in kleinere Segmente für einen Discovery-Zeitplan oder das Laden kleinerer Datensegmente innerhalb eines Importauftrags.
    • CPU : Reduzieren Sie die Aktivität auf dem Host, oder migrieren Sie den MID-Server zu einem neuen Host mit mehr verfügbaren Ressourcen.
      Hinweis:
      DER MID-Server kann während der Discovery einen Anstieg der Ressourcennutzung erstellen, insbesondere die Erkennung für eine große Anzahl von Zielen oder die gleichzeitige Ausführung mehrerer Power Shell-Sitzungen. Die Ressourcennutzung des MID-Serverhosts kehrt automatisch in den Normalzustand zurück, nachdem die Discovery-Ausführung erfolgreich beendet wurde. Um die CPU-Auslastung zu verringern, hosten Sie den MID-Server auf einem dedizierten Computer. Wenn Probleme mit der Ressourcennutzung auftreten, stellen Sie sicher, dass auf jedem dedizierten Hostcomputer nur ein MID-Server ausgeführt wird. Wenn der MID-Server in einer öffentlichen Cloud gehostet wird, fügen Sie weitere CPU-Ressourcen hinzu, und vermeiden Sie das Problem mit lauten Nachbarn. Weitere Informationen finden Sie unter Hohe CPU-Auslastung auf Host mit MID-Server [KB0597639] .

    Tabellen, die für die Bewertung des Ressourcenschwellenwerts verwendet werden

    Tabelle Beschreibung
    MID-Serverproblem [ecc_Agent_issue] Speichert Daten zu verschiedenen Arten von MID-Serverproblemen, einschließlich Verstößen gegen konfigurierte CPU- und Arbeitsspeicherschwellenwerte. Für Ressourcenschwellenwertverletzungen verwendete Felder sind:
    • Anzahl : Anzahl der Male, an denen ein zuvor gemeldeter Schwellenwertverstoß auftritt, wenn das Ereignis nicht markiert ist Gelöst .
    • Last_detected : Aktuelles Datum und Uhrzeit, zu der ein Schwellenwertverstoß erkannt wird. Dieses Feld wird jedes Mal aktualisiert, wenn ein zuvor erkannter Verstoß gefunden wird, sofern er nicht markiert ist Gelöst .
    • Nachricht : Beschreibende Nachricht, die die Bedingungen zusammenfasst, die das Ereignis „Schwellenwertverletzung“ ausgelöst haben. Diese Nachricht enthält den tatsächlich berechneten Prozentsatz von CPU und Arbeitsspeicher und die konfigurierten Schwellenwerte, die überschritten wurden.
    • Mid_Server : Name des MID-Servers, bei dem der Ressourcenschwellenwert verletzt wird.
    • Quelle : Die Problemquelle für den Verstoß. Dies sind die möglichen Quellen:
      • CpuMIDResourceThresholdBreach : Quellen des CPU-Schwellenwertproblems.
      • ArbeitsspeicherMIDResourceThresholdBreach : Problemquellen des Arbeitsspeicherschwellenwerts.
    MID-Serverstatus [ecc_Agent_Status] Speichert die Prozentsätze, die für die CPU- und Arbeitsspeicherressourcen verwendet werden, gemittelt über konfigurierbare Intervalle für jede Ressource. Die verwendeten Felder sind:
    • Mittlere CPU-Auslastung %
    • Max. Verwendeter Arbeitsspeicher %
    ECC-Mitarbeiterskalarmetrik [ecc_agent_scalar_metric] Speichert die von jedem MID-Server eingefügten CPU-Nutzungsdaten alle 10 Minuten. Das Tabellenfeld, das von der Ressourcenschwellenwertwarnung verwendet wird, ist Mittelwert .
    ECC-Mitarbeiterspeichermetrik [ecc_agent_memory_metric] Speichert die von jedem MID-Server eingefügten Speichernutzungsdaten alle 10 Minuten. Das Tabellenfeld, das von der Ressourcenschwellenwertwarnung verwendet wird, ist max_used_pct .

    Business-Regeln, die auf Schwellenwertverletzungen prüfen

    Geschäftsregel Beschreibung
    Aktualisieren Sie den cpu-Mittelwert für den MID-Serverstatus Wird ausgeführt, nachdem der MID-Server einen Datensatz in die Tabelle „ECC-Agenten-Skalarmetrik [ecc_agent_scalar_metric]“ eingefügt hat. Diese Business-Regel löst aus MIDResourceThresholdBreach Skripteinbindungsfunktion, die Schwellenwerteinstellungen auswertet, um zu bestimmen, ob der MID-Server seine konfigurierten CPU-Ressourcenschwellenwerte überschritten hat.
    Aktualisieren Sie den maximalen Arbeitsspeicher für den MID-Serverstatus Wird ausgeführt, nachdem der MID-Server einen Datensatz in die Tabelle „ECC-Mitarbeiterspeichermetrik [ecc_agent_memory_metric]“ eingefügt hat. Diese Business-Regel löst aus MIDResourceThresholdBreach Skripteinbindungsfunktion, die Schwellenwerteinstellungen auswertet, um zu bestimmen, ob der MID-Server die konfigurierten Schwellenwerte für Arbeitsspeicherressourcen überschritten hat.

    Konfigurieren von Schwellenwerten und Stichprobenintervallen

    Sie können die standardmäßigen Schwellenwertprozentsätze und Abtastintervalle verwenden oder anwenderdefinierte Werte mit einer der folgenden Methoden konfigurieren:
    Die Systemeigenschaften und Konfigurationsparameter verwenden dieselben Namen.
    Eigenschafts-/Konfigurationsparameter Beschreibung
    mid.threshold.mean_cpu.aggregate_interval_span Anzahl der 10-Minuten-Einheiten im Intervall für die Sampling von CPU-Nutzungsdaten. Das Standardintervall beträgt 30 Minuten (3 x 10 Minuten).

    Standard : 3

    Mid.threshold.mean_cpu.percent Auslastungsprozentsatz der gesamten CPU-Ressourcen, die eine Warnung über Schwellenwertverletzung initiieren.

    Standard : 95

    mid.threshold.mean_max_memory.aggregate_interval_span Anzahl der 10-Minuten-Einheiten im Intervall für die Sampling-Speichernutzungsdaten. Das Standardintervall beträgt 30 Minuten (3 x 10 Minuten).

    Standard : 3

    Mid.threshold.mean_max_Memory.percent Auslastungsprozentsatz der Gesamtspeicherressourcen, die eine Warnung über Schwellenwertverletzung initiieren.

    Standard : 95

    Berichterstellung der MID-Serverressource

    Die MID-Server-Dashboard Enthält zwei Berichte, die Ihnen Einblicke in den Verbrauch von CPU- und JVM-Arbeitsspeicherressourcen geben. Diese Berichte zeigen die Nutzung in den letzten 30 Tagen.
    • Durchschnittlicher Prozentsatz der verwendeten CPU : Die Trendanalyse des täglichen Durchschnitts der CPU-Auslastung hilft, die Menge der CPU-Verarbeitung zu veranschaulichen, die der MID-Server-Host verbraucht. MID-Server, die auf demselben Host bereitgestellt werden, melden dieselbe CPU-Auslastung.
    • Durchschnittlicher Prozentsatz des maximal verwendeten Arbeitsspeichers : Der maximal verwendete Prozentsatz ( max_used_pct) Ist eine nützliche Metrik, um zu bestimmen, ob der MID-Server über genügend Arbeitsspeicherressourcen verfügt. Diese Metrik ist ein Prozentsatz des maximal verwendeten Arbeitsspeichers im Vergleich zum insgesamt verfügbaren Arbeitsspeicher. Wenn Sie diesen Trend im Zeitverlauf anzeigen, wird visualisiert, wie viel Arbeitsspeicher der MID-Server benötigt.