Warnungen bei Schwellenwert für MID-Server-Ressource
Die Instanz zeigt Warnungen an, wenn ein MID-Server seine Ressourcenschwellenwerte für die CPU- und JVM-Arbeitsspeicherauslastung verletzt. Dadurch können Benutzer E-Mail-Benachrichtigungen oder benutzerdefinierte Skripts erstellen, wenn ein Verstoß auftritt.
Die Tabelle „MID-Server“ [ecc_agent_issue] warnt Benutzer, wenn ein MID-Server die konfigurierten Schwellenwerte der zugewiesenen CPU- und Speicherressourcen überschreitet. Diese Warnungen werden veröffentlicht, bevor der MID-Server eine Leistungsverschlechterung oder einen Fehler aufgrund von nicht genügendem Arbeitsspeicher aufweist. Dadurch kann der Administrator die Ressourcen erhöhen und Ausfallzeiten vermeiden. Administratoren können ein registriertes Event verwenden, um eine E-Mail-Benachrichtigung an ausgewählte Empfänger zu senden, sie über Schwellenwertverletzungen zu informieren oder ein benutzerdefiniertes Skript für andere Aufgaben zu erstellen. Die Instanz aktualisiert weiterhin die Tabelle „MID-Serverproblem“ [ecc_agent_issue], um die nicht gelösten Probleme aktuell zu halten.
- mid.threshold.resource.breach.enable.cpu.alerts
- mid.threshold.resource.breach.enable.memory.alerts
Auswertungsvorgang
- Alle 10 Minuten übermittelt jeder MID-Server seine CPU- und Speicherverbrauchsmesswerte an die Instanz. Die Instanz fügt CPU-Metriken in das Feld Mittlere CPU-Auslastung % der Tabelle „ECC-Agent-Skalarmetriken“ [ecc_agent_scalar_metric] und Speichermetriken in das Feld Max. verwendeter Speicher % der Tabelle „ECC-Agent-Speichermetriken“ [ecc_agent_memory_metric] ein.
- Nach dem erfolgreichen Einfügen werden für jede Tabelle die folgenden Business Rules ausgeführt, die eine Skripteinbindung aufrufen, die eine entsprechende Funktion aufruft. Für jede Funktion wird ein Durchschnitt der in die Tabellen eingefügten Metrik-Sets basierend auf den konfigurierten Samplingintervallen ermittelt.
- CPU-Mittelwert für den MID-Serverstatus aktualisieren: Ruft die Skripteinbindung MIDResourceThresholdBreach.checkCpuUsage() auf.
- Maximalen Speicher des MID-Serverstatus aktualisieren: Ruft die Skripteinbindung MIDResourceThresholdBreach.checkMemoryUsage auf.
Für jede Funktion wird ein Durchschnitt der in die Tabellen eingefügten Metrik-Sets basierend auf den konfigurierten Schwellenwerten und Samplingintervallen ermittelt. Die Instanz sucht zunächst bei jedem MID-Server nach Konfigurationsparametern, die benutzerdefinierte Schwellenwerte oder Samplingintervalle für diesen MID-Server festlegen. Wenn keine Konfigurationsparameter für diese Attribute gefunden werden, sucht die Instanz in der Tabelle „Systemeigenschaften“ [sys_properties] nach benutzerdefinierten Werten, die verwendet werden sollen. Wenn keine Eigenschaften gefunden werden, verwendet die Instanz den Standardschwellenwert und die Intervallwerte aus dem Code.Hinweis:Sowohl die Prozentsätze der Schwellenwerte als auch die Samplingintervalle sind konfigurierbar. Unter Schwellenwerte und Samplingintervalle konfigurieren finden Sie weitere Details.
Alarmierungsprozess
- Wenn der aggregierte durchschnittliche Metrikwert den konfigurierten Prozentschwellenwert erreicht oder überschreitet, löst die Instanz das Ereignis mid.threshold.resource.breach aus. Administratoren können dieses Ereignis verwenden, um E-Mail-Benachrichtigungen für Warnungen über Schwellenwerte zu erstellen oder ein anwenderdefiniertes Skript zu erstellen.
- Die Instanz fügt einen Datensatz des Verstoßes mit dem Status Neu und der Anzahl 1 in die Tabelle „MID-Serverproblem“ [ecc_agent_issue] ein und veröffentlicht dann eine Nachricht mit allen relevanten Details des Verstoßes. Ein Beispiel für diese Nachricht ist
Mittlere CPU-Auslastung % hat Schwellenwert (96>=91) für eine 40-Minuten-Intervall überschritten, der nach dem Startdatum 2017-01-11 14:25:19 auftritt. Diese Meldung erscheint im Feld Kurzbeschreibung des Formulars „MID-Serverproblem“ und im Event. Sie können einen beliebigen Teil der Nachricht in Ihre E-Mail-Benachrichtigungen kopieren.
MID-Serverproblemstatus
Empfehlungen zur Lösung von Ressourcenproblemen
- JVM-Speicher:
- Weisen Sie dem MID-Server mehr maximalen Arbeitsspeicher zu. Weitere Informationen finden Sie unter Legt die Größe des MID-Server-JVM-Arbeitsspeichers fest.
- Fügen Sie weitere MID-Server hinzu, um die Arbeitsauslastung gemeinsam zu nutzen. Weitere Informationen finden Sie unter MID-Server-Cluster.
- Reduzieren Sie den Umfang der gleichzeitigen Verarbeitung für den MID-Server. Dies umfasst die Segmentierung von IP-Adressbereichen in kleinere Segmente für einen Discovery-Zeitplan oder das Laden kleinerer Datensegmente innerhalb eines Importauftrags.
- CPU: Reduzieren Sie die Aktivität auf dem Host oder migrieren Sie den MID-Server auf einen neuen Host mit mehr verfügbaren Ressourcen. Hinweis:Der MID-Server kann während der Discovery eine Spitze bei der Ressourcennutzung erzeugen, insbesondere bei der Erkennung einer großen Anzahl von Zielen oder der Ausführung mehrerer Power Shell-Sitzungen gleichzeitig. Die Ressourcennutzung des MID-Server-Hosts wird automatisch wieder normalisiert, nachdem die Discovery-Ausführung erfolgreich beendet wurde. Hosten Sie den MID-Server auf einem dedizierten Computer, um die CPU-Auslastung zu verringern. Wenn Probleme mit der Ressourcennutzung auftreten, stellen Sie sicher, dass auf jedem dedizierten Hostcomputer nur ein MID-Server ausgeführt wird. Wenn der MID-Server in einer Public Cloud gehostet wird, fügen Sie mehr CPU-Ressourcen hinzu, und vermeiden Sie das Problem der lauten Nachbargeräte. Weitere Informationen finden Sie unter Hohe CPU-Auslastung auf Host mit MID-Servern [KB0597639].
Tabellen, die für die Auswertung der Ressourcenschwellenwerte verwendet werden
| Tabelle | Beschreibung |
|---|---|
| MID-Serverproblem [ecc_agent_issue] | Speichert Daten zu verschiedenen Arten von MID-Server-Problemen, einschließlich Verstößen gegen konfigurierte CPU- und Speicherschwellenwerte. Felder, die für Verletzungen gegen Ressourcenschwellenwerte verwendet werden, sind:
|
| MID-Serverstatus [ecc_agent_status] | Speichert die für CPU- und Speicherressourcen verwendeten Prozentsätze, gemittelt über konfigurierbare Intervalle für jede Ressource. Die verwendeten Felder sind:
|
| ECC-Agent-Skalarmetrik [ecc_agent_scalar_metric] | Speichert die von jedem MID-Server eingefügten CPU-Auslastungsdaten alle 10 Minuten. Das Tabellenfeld, das für die Warnung des Ressourcenschwellenwerts verwendet wird, lautet Mittelwert. |
| ECC-Agent-Speichermetrik [ecc_agent_memory_metric] | Speichert die von jedem MID-Server eingefügten Speicherbelegungsdaten alle 10 Minuten. Das Tabellenfeld, das für die Warnung der Ressourcenschwellenwerte verwendet wird, lautet max_used_pct. |
Business Rules, die auf Schwellenwertverletzungen prüfen
| Business Rule | Beschreibung |
|---|---|
| Den CPU-Mittelwert für den MID-Serverstatus aktualisieren | Wird ausgeführt, nachdem der MID-Server einen Datensatz in die Tabelle „ECC-Agent-Skalarmetrik“ [ecc_agent_scalar_metric] eingefügt hat. Diese Business Rule löst die Skripteinbindungsfunktion MIDResourceThresholdBreach aus, die Schwellenwerteinstellungen auswertet, um festzustellen, ob der MID-Server seine konfigurierten CPU-Ressourcenschwellenwerte verletzt hat. |
| Aktualisieren Sie den maximalen Speicher des MID-Serverstatus | Wird ausgeführt, nachdem der MID-Server einen Datensatz in die Tabelle „ECC-Agent-Speichermetrik“ [ecc_agent_memory_metric] eingefügt hat. Diese Business Rule löst die Skripteinbindungsfunktion MIDResourceThresholdBreach aus, die Schwellenwerteinstellungen auswertet, um festzustellen, ob der MID-Server die konfigurierten Schwellenwerte für Speicherressourcen verletzt hat. |
Schwellenwerte und Samplingintervalle konfigurieren
- Fügen Sie der Instanz Systemeigenschaften hinzu, und ändern Sie die Standardwerte für alle MID Server.
- Konfigurationsparameter hinzufügen, um die Standardressourcenwerte für einzelne MID-Server zu ändern.
| Eigenschafts-/Konfigurationsparameter | Beschreibung |
|---|---|
| mid.threshold.mean_cpu.aggregate_interval_span | Anzahl der 10-Minuten-Einheiten im Intervall für das Sampling von CPU-Auslastungsdaten. Das Standardintervall beträgt 30 Minuten (3 x 10 Minuten). Standard: 3 |
| mid.threshold.mean_cpu.percent | Prozentsatz der Nutzung der gesamten CPU-Ressourcen, die eine Alarmmeldung zur Schwellenwertverletzung auslösen. Standard: 95 |
| mid.threshold.mean_max_memory.aggregate_interval_span | Anzahl von 10-Minuten-Einheiten im Intervall für das Sampling von Speicherbelegungsdaten. Das Standardintervall beträgt 30 Minuten (3 x 10 Minuten). Standard: 3 |
| mid.threshold.mean_max_memory.percent | Prozentsatz der Nutzung der gesamten Speicherressourcen, die eine Warnmeldung zur Schwellenwertverletzung auslösen. Standard: 95 |
MID Server-Ressourcenberichte
- Durchschnittlicher Prozentsatz der verwendeten CPU: Der tägliche Durchschnitt der CPU-Auslastung zeigt, wie viel CPU-Verarbeitung der MID-Server-Host verbraucht. Auf demselben Host bereitgestellte MID-Server melden dieselbe CPU-Auslastung.
- Durchschn. Prozentsatz des max. verwendeten Arbeitsspeichers: Der maximal verwendete Prozentsatz (max_used_pct) ist eine nützliche Metrik, um zu bestimmen, ob der MID-Server über genügend Arbeitsspeicherressourcen verfügt. Diese Metrik ist ein Prozentsatz des maximal verwendeten Speichers im Verhältnis zum insgesamt verfügbaren Speicher. Wenn Sie dies im Laufe der Zeit ändern, wird visualisiert, wie viel Speicher der MID-Server benötigt.