Schwellenwertwarnungen für MID-Serverressource
Die Instanz zeigt Warnungen an, wenn ein MID-Server seine Ressourcenschwellenwerte für die CPU- und JVM-Arbeitsspeichernutzung verletzt, sodass Anwender E-Mail-Benachrichtigungen oder anwenderdefinierte Skripts erstellen können, wenn ein Verstoß auftritt.
Die Tabelle „MID-Serverproblem“ [ecc_Agent_issue] warnt Anwender, wenn ein MID-Server die konfigurierten Schwellenwerte seiner zugewiesenen CPU- und Arbeitsspeicherressourcen überschreitet. Diese Warnungen werden veröffentlicht, bevor auf dem MID-Server eine Verschlechterung der Leistung oder ein Fehler mit zu wenig Arbeitsspeicher auftritt, sodass der Administrator Ressourcen erhöhen und Ausfallzeiten vermeiden kann. Administratoren können ein registriertes Ereignis verwenden, um E-Mail-Benachrichtigungen an ausgewählte Empfänger zu senden und sie über Schwellenwertverletzungen zu informieren oder ein anwenderdefiniertes Skript zu erstellen, um eine andere Art von Arbeit auszuführen. Die Instanz aktualisiert die Tabelle „MID-Serverproblem“ [ecc_Agent_issue] weiterhin, um ungelöste Probleme aktuell zu halten.
- mid.threshold.resource.breach.enable.cpu.alerts
- mid.threshold.resource.breach.enable.memory.alerts
Bewertungsprozess
- Alle 10 Minuten überträgt jeder MID-Server seine CPU- und Arbeitsspeicherverbrauchsmetriken an die Instanz. Die Instanz fügt CPU-Metriken in ein Durchschnittliche CPU-Auslastung % Feld der Tabelle „ECC-Agenten-Skalarmetriken“ [ecc_agent_scalar_metric] und Arbeitsspeichermetriken in Max. Verwendeter Arbeitsspeicher % Feld der Tabelle „ECC-Mitarbeiterspeichermetriken [ecc_agent_memory_metric]“.
- Nach einem erfolgreichen Einfügen werden die folgenden Business-Regeln für jede Tabelle ausgeführt, wodurch eine Skripteinbindung aufgerufen wird, die eine entsprechende Funktion aufruft. Jede Funktion verwendet einen Durchschnitt der Metriksätze, die in die Tabellen eingefügt werden, basierend auf den konfigurierten Stichprobenintervallen.
- Aktualisieren Sie den cpu-Mittelwert für den MID-Serverstatus : Ruft auf MIDResourceThresholdBreach.checkCpuUsage() Skripteinbindung.
- Aktualisieren Sie den maximalen Arbeitsspeicher für den MID-Serverstatus : Ruft auf MIDResourceThresholdBreach.checkMemoryUsage Skripteinbindung.
Jede Funktion verwendet einen Durchschnitt der Metriksätze, die in die Tabellen eingefügt werden, basierend auf den konfigurierten Schwellenwerten und Stichprobenintervallen. Die Instanz untersucht zuerst jeden MID-Server nach Konfigurationsparametern, die anwenderdefinierte Schwellenwerte oder Stichprobenintervalle für diesen MID-Server festlegen. Wenn keine Konfigurationsparameter für diese Attribute gefunden werden, sucht die Instanz in der Tabelle „Systemeigenschaften“ [sys_properties] nach anwenderdefinierten Werten, die verwendet werden sollen. Wenn keine Eigenschaften gefunden werden, verwendet die Instanz die Standardschwellenwert- und Intervallwerte aus dem Code.Hinweis:Sowohl die Schwellenwertprozentsätze als auch die Stichprobenintervalle sind konfigurierbar. Details siehe Konfigurieren von Schwellenwerten und Stichprobenintervallen.
Warnungsprozess
- Wenn der aggregierte durchschnittliche Metrikwert dem konfigurierten Prozentwert entspricht oder überschreitet, löst die Instanz aus mid.threshold.resource.breachEreignis. Administratoren können dieses Ereignis zum Erstellen verwenden E-Mail-Benachrichtigungen Für Warnungen bei Schwellenwertverletzungen oder zum Erstellen eines anwenderdefinierten Skripts.
- Die Instanz fügt einen Datensatz des Verstoßes mit in die Tabelle „MID-Serverproblem“ [ecc_Agent_issue] ein Status Wert von Neu Und A Anzahl Von 1 und veröffentlicht dann eine Nachricht, die alle relevanten Details des Verstoßes enthält. Ein Beispiel für diese Nachricht ist
Die durchschnittliche CPU-Auslastung in % hat den Schwellenwert (96>=91) für eine Intervallspanne von 40 Minuten überschritten, die nach dem Startdatum 2017-01-11 14:25:19 auftritt. Diese Nachricht wird in angezeigt Kurzbeschreibung Feld des Formulars „MID-Serverproblem“ und im Ereignis. Sie können jeden Teil der Nachricht in Ihre E-Mail-Benachrichtigungen kopieren.
status des MID-Server-Problems
Empfehlungen zur Lösung von Ressourcenproblemen
- JVM-Arbeitsspeicher :
- Weisen Sie dem MID-Server mehr maximalen Arbeitsspeicher zu. Weitere Informationen finden Sie unter Legen Sie die Größe des MID-Server-JVM-Arbeitsspeichers fest.
- Fügen Sie zusätzliche MID-Server hinzu, um die Arbeitsauslastung freizugeben. Weitere Informationen finden Sie unter MID-Server-Cluster.
- Reduzieren Sie den Umfang der gleichzeitigen Verarbeitung für den MID-Server. Dies umfasst die Segmentierung von IP-Adressbereichen in kleinere Segmente für einen Discovery-Zeitplan oder das Laden kleinerer Datensegmente innerhalb eines Importauftrags.
- CPU : Reduzieren Sie die Aktivität auf dem Host, oder migrieren Sie den MID-Server zu einem neuen Host mit mehr verfügbaren Ressourcen. Hinweis:DER MID-Server kann während der Discovery einen Anstieg der Ressourcennutzung erstellen, insbesondere die Erkennung für eine große Anzahl von Zielen oder die gleichzeitige Ausführung mehrerer Power Shell-Sitzungen. Die Ressourcennutzung des MID-Serverhosts kehrt automatisch in den Normalzustand zurück, nachdem die Discovery-Ausführung erfolgreich beendet wurde. Um die CPU-Auslastung zu verringern, hosten Sie den MID-Server auf einem dedizierten Computer. Wenn Probleme mit der Ressourcennutzung auftreten, stellen Sie sicher, dass auf jedem dedizierten Hostcomputer nur ein MID-Server ausgeführt wird. Wenn der MID-Server in einer öffentlichen Cloud gehostet wird, fügen Sie weitere CPU-Ressourcen hinzu, und vermeiden Sie das Problem mit lauten Nachbarn. Weitere Informationen finden Sie unter Hohe CPU-Auslastung auf Host mit MID-Server [KB0597639] .
Tabellen, die für die Bewertung des Ressourcenschwellenwerts verwendet werden
| Tabelle | Beschreibung |
|---|---|
| MID-Serverproblem [ecc_Agent_issue] | Speichert Daten zu verschiedenen Arten von MID-Serverproblemen, einschließlich Verstößen gegen konfigurierte CPU- und Arbeitsspeicherschwellenwerte. Für Ressourcenschwellenwertverletzungen verwendete Felder sind:
|
| MID-Serverstatus [ecc_Agent_Status] | Speichert die Prozentsätze, die für die CPU- und Arbeitsspeicherressourcen verwendet werden, gemittelt über konfigurierbare Intervalle für jede Ressource. Die verwendeten Felder sind:
|
| ECC-Mitarbeiterskalarmetrik [ecc_agent_scalar_metric] | Speichert die von jedem MID-Server eingefügten CPU-Nutzungsdaten alle 10 Minuten. Das Tabellenfeld, das von der Ressourcenschwellenwertwarnung verwendet wird, ist Mittelwert . |
| ECC-Mitarbeiterspeichermetrik [ecc_agent_memory_metric] | Speichert die von jedem MID-Server eingefügten Speichernutzungsdaten alle 10 Minuten. Das Tabellenfeld, das von der Ressourcenschwellenwertwarnung verwendet wird, ist max_used_pct . |
Business-Regeln, die auf Schwellenwertverletzungen prüfen
| Geschäftsregel | Beschreibung |
|---|---|
| Aktualisieren Sie den cpu-Mittelwert für den MID-Serverstatus | Wird ausgeführt, nachdem der MID-Server einen Datensatz in die Tabelle „ECC-Agenten-Skalarmetrik [ecc_agent_scalar_metric]“ eingefügt hat. Diese Business-Regel löst aus MIDResourceThresholdBreach Skripteinbindungsfunktion, die Schwellenwerteinstellungen auswertet, um zu bestimmen, ob der MID-Server seine konfigurierten CPU-Ressourcenschwellenwerte überschritten hat. |
| Aktualisieren Sie den maximalen Arbeitsspeicher für den MID-Serverstatus | Wird ausgeführt, nachdem der MID-Server einen Datensatz in die Tabelle „ECC-Mitarbeiterspeichermetrik [ecc_agent_memory_metric]“ eingefügt hat. Diese Business-Regel löst aus MIDResourceThresholdBreach Skripteinbindungsfunktion, die Schwellenwerteinstellungen auswertet, um zu bestimmen, ob der MID-Server die konfigurierten Schwellenwerte für Arbeitsspeicherressourcen überschritten hat. |
Konfigurieren von Schwellenwerten und Stichprobenintervallen
- Fügen Sie Systemeigenschaften hinzu In die Instanz und ändern Sie die Standardwerte für alle MID-Server.
- Hinzufügen Konfigurationsparameter Zum Ändern der Standardressourcenwerte für einzelne MID-Server.
| Eigenschafts-/Konfigurationsparameter | Beschreibung |
|---|---|
| mid.threshold.mean_cpu.aggregate_interval_span | Anzahl der 10-Minuten-Einheiten im Intervall für die Sampling von CPU-Nutzungsdaten. Das Standardintervall beträgt 30 Minuten (3 x 10 Minuten). Standard : 3 |
| Mid.threshold.mean_cpu.percent | Auslastungsprozentsatz der gesamten CPU-Ressourcen, die eine Warnung über Schwellenwertverletzung initiieren. Standard : 95 |
| mid.threshold.mean_max_memory.aggregate_interval_span | Anzahl der 10-Minuten-Einheiten im Intervall für die Sampling-Speichernutzungsdaten. Das Standardintervall beträgt 30 Minuten (3 x 10 Minuten). Standard : 3 |
| Mid.threshold.mean_max_Memory.percent | Auslastungsprozentsatz der Gesamtspeicherressourcen, die eine Warnung über Schwellenwertverletzung initiieren. Standard : 95 |
Berichterstellung der MID-Serverressource
- Durchschnittlicher Prozentsatz der verwendeten CPU : Die Trendanalyse des täglichen Durchschnitts der CPU-Auslastung hilft, die Menge der CPU-Verarbeitung zu veranschaulichen, die der MID-Server-Host verbraucht. MID-Server, die auf demselben Host bereitgestellt werden, melden dieselbe CPU-Auslastung.
- Durchschnittlicher Prozentsatz des maximal verwendeten Arbeitsspeichers : Der maximal verwendete Prozentsatz ( max_used_pct) Ist eine nützliche Metrik, um zu bestimmen, ob der MID-Server über genügend Arbeitsspeicherressourcen verfügt. Diese Metrik ist ein Prozentsatz des maximal verwendeten Arbeitsspeichers im Vergleich zum insgesamt verfügbaren Arbeitsspeicher. Wenn Sie diesen Trend im Zeitverlauf anzeigen, wird visualisiert, wie viel Arbeitsspeicher der MID-Server benötigt.