Alertes de seuil de ressource de Serveur MID
L’instance affiche des avertissements lorsqu’un Serveur MID dépasse ses seuils de ressources pour l’utilisation du processeur et de la mémoire JVM, ce qui permet aux utilisateurs de créer des notifications par e-mail ou des scripts personnalisés lorsqu’une violation se produit.
La table Problème de serveur MID [ecc_agent_issue] avertit les utilisateurs lorsqu’un serveur MID dépasse les seuils configurés des ressources de mémoire et de processeur qui lui sont allouées. Ces avertissements sont publiés avant que le MID Server ne subisse une dégradation des performances ou une erreur de mémoire insuffisante, ce qui permet à l’administrateur d’augmenter les ressources et d’éviter les temps d’arrêt. Les administrateurs peuvent utiliser un événement enregistré pour envoyer une notification par e-mail aux destinataires sélectionnés, les informer de tout dépassement de seuil, ou pour créer un script personnalisé afin d’effectuer un autre type de travail. L’instance continue de mettre à jour la table Problème de Serveur MID [ecc_agent_issue] pour tenir à jour les problèmes non résolus.
- mid.threshold.resource.breach.enable.cpu.alerts
- mid.threshold.resource.breach.enable.memory.alerts
Processus d’évaluation
- Toutes les 10 minutes, chaque MID Server transmet ses mesures de consommation de processeur et de mémoire à l’instance. L’instance insère les mesures de processeur dans le champ % moyen d’utilisation du processeur de la table Mesures scalaires d’agent ECC [ecc_agent_scalar_metric] et les mesures de mémoire dans le champ % d’utilisation max. de mémoire de la table Mesures de mémoire d’agent ECC [ecc_agent_memory_metric].
- Après une insertion réussie, les règles métier suivantes s’exécutent sur chaque table, appelant un include de script qui appelle une fonction appropriée. Chaque fonction utilise une moyenne des jeux de mesures insérés dans les tables, en fonction des intervalles d’échantillonnage configurés.
- Mettre à jour la moyenne du processeur sur l’état du serveur MID : appelle l’include de script MIDResourceThresholdBreach.checkCpuUsage().
- Mettre à jour la mémoire maximale sur le serveur MID État : appelle l’include de script MIDResourceThresholdBreach.checkMemoryUsage .
Chaque fonction utilise une moyenne des ensembles de mesures insérés dans les tables, en fonction des seuils et des intervalles d’échantillonnage configurés. L’instance examine d’abord chaque Serveur MID pour les paramètres de configuration qui définissent des valeurs de seuil personnalisées ou des intervalles d’échantillonnage pour ce Serveur MID. Si aucun paramètre de configuration n’est trouvé pour ces attributs, l’instance recherche des valeurs personnalisées à utiliser dans la table Propriétés système [sys_properties]. Si aucune propriété n’est trouvée, l’instance utilise les valeurs de seuil et d’intervalle par défaut du code.Remarque :Les pourcentages de seuil et les intervalles d’échantillonnage sont configurables. Consultez Configuration des seuils et des intervalles d’échantillonnage pour en savoir plus.
Processus d’alerte
- Si la valeur de mesure moyenne agrégée est égale ou supérieure au seuil de pourcentage configuré, l’instance déclenche l’événement mid.threshold.resource.breach . Les administrateurs peuvent utiliser cet événement pour créer des notifications par e-mail pour les alertes de violation de seuil ou pour créer un script personnalisé.
- L’instance insère un enregistrement de la violation dans la table Problème [ecc_agent_issue] de Serveur MID avec une valeur d’étatNouveau et un décompte de 1, puis publie un message contenant tous les détails pertinents de la violation. Un exemple de ce message est
Le % moyen d’utilisation du processeur a dépassé le seuil (96>=91) pendant un intervalle de 40 minutes, survenant après la date de début 2017-01-11 14:25:19. Ce message s’affiche dans le champ Brève description du formulaire Problème de Serveur MID et dans l’événement. Vous pouvez copier n’importe quelle partie du message dans vos notifications par e-mail.
États des problèmes du Serveur MID
Recommandations pour résoudre les problèmes de ressources
- Mémoire JVM :
- Allouez plus de mémoire maximale au serveur MID. Pour plus d'informations, consultez Définir la taille de la mémoire JVM du Serveur MID.
- Ajoutez des MID Servers supplémentaires pour partager la charge de travail. Pour plus d'informations, consultez Grappes de Serveur MID.
- Réduisez la quantité de traitement simultané pour le MID Server. Cela inclut la segmentation des plages d’adresses IP en segments plus petits pour un calendrier de détection ou le chargement de segments de données plus petits dans une tâche d’importation.
- Processeur : réduisez l’activité sur l’hôte ou migrez le serveur MID vers un nouvel hôte disposant de plus de ressources disponibles. Remarque :MID Server peut créer un pic d’utilisation des ressources pendant la détection, en particulier la détection sur un grand nombre de cibles ou l’exécution simultanée de plusieurs sessions Power Shell. L’utilisation des ressources de l’hôte du Serveur MID revient automatiquement à la normale après l’arrêt réussi de l’exécution de Découverte. Pour réduire l’utilisation du processeur, hébergez le serveur MID sur une machine dédiée. Si vous rencontrez des problèmes d’utilisation des ressources, assurez-vous qu’un seul serveur MID est exécuté sur chaque machine hôte dédiée. Si le MID Server est hébergé sur un cloud public, ajoutez des ressources de processeur supplémentaires et évitez le problème de voisinage bruyant. Pour plus d’informations, reportez-vous à la section Utilisation élevée du processeur sur l’hôte avec un ou plusieurs MID Server [KB0597639].
Tables utilisées pour l’évaluation du seuil de ressource
| Table | Description |
|---|---|
| Problème de Serveur MID [ecc_agent_issue] | Stocke des données sur divers types de problèmes de Serveur MID, y compris les violations des seuils configurés de processeur et de mémoire. Les champs utilisés pour les violations de seuil de ressources sont les suivants :
|
| État du serveur MID [ecc_agent_status] | Stocke les pourcentages utilisés pour les ressources de processeur et de mémoire, moyennés sur des intervalles configurables pour chaque ressource. Les champs utilisés sont les suivants :
|
| Métrique scalaire d’agent ECC [ecc_agent_scalar_metric] | Stocke les données d’utilisation du processeur insérées par chaque serveur MID toutes les 10 minutes. Le champ de table utilisé par les alertes de seuil de ressource est moyen. |
| Mesure de la mémoire d’agent ECC [ecc_agent_memory_metric] | Stocke les données d’utilisation de la mémoire insérées par chaque serveur MID toutes les 10 minutes. Le champ de table utilisé par les alertes de seuil de ressource est max_used_pct. |
Règles métier qui vérifient les violations de seuil
| Règle métier | Description |
|---|---|
| Mettre à jour la moyenne du processeur sur l’état du serveur MID | S’exécute après que le Serveur MID a inséré un enregistrement dans la table Métrique scalaire d’agent ECC [ecc_agent_scalar_metric]. Cette règle métier déclenche la fonction d’include de script MIDResourceThresholdBreach qui évalue les paramètres de seuil afin de déterminer si le Serveur MID a dépassé ses seuils de ressource de processeur configurés. |
| Mettre à jour la mémoire maximale sur l’état du serveur MID | S’exécute après que le Serveur MID a inséré un enregistrement dans la table Métrique de la mémoire d’agent ECC [ecc_agent_memory_metric]. Cette règle métier déclenche la fonction de script include MIDResourceThresholdBreach qui évalue les paramètres de seuil afin de déterminer si le serveur MID a dépassé ses seuils de ressource de mémoire configurés. |
Configuration des seuils et des intervalles d’échantillonnage
- Ajoutez des propriétés système à l’instance et modifiez les valeurs par défaut pour tous les serveurs MID.
- Ajoutez des paramètres de configuration pour changer les valeurs de ressources par défaut pour chaque MID Server.
| Paramètre de propriété/configuration | Description |
|---|---|
| mid.threshold.mean_cpu.aggregate_interval_span | Nombre d’unités de 10 minutes dans l’intervalle d’échantillonnage des données d’utilisation du processeur. L’intervalle par défaut est de 30 minutes (3 x 10 min.) Par défaut : 3 |
| mid.threshold.mean_cpu,pour cent | Pourcentage d’utilisation des ressources de processeur totales qui déclenchent une alerte de violation de seuil. Par défaut : 95 |
| mid.threshold.mean_max_memory.aggregate_interval_span | Nombre d’unités de 10 minutes dans l’intervalle pour l’échantillonnage des données d’utilisation de la mémoire. L’intervalle par défaut est de 30 minutes (3 x 10 min.) Par défaut : 3 |
| mid.threshold.mean_max_memory,pour cent | Pourcentage d’utilisation des ressources de mémoire totales qui déclenche une alerte de violation de seuil. Par défaut : 95 |
Génération de rapports de ressources de Serveur MID
- Pourcentage moy. d’utilisation du processeur : la tendance de la moyenne quotidienne de l’utilisation du processeur permet d’illustrer la quantité de traitement du processeur consommée par l’hôte du serveur MID. Les MID Servers déployés sur le même hôte signaleront la même utilisation du processeur.
- Pourcentage moy. de mémoire max. utilisée : le pourcentage maximal utilisé (max_used_pct) est une mesure utile pour déterminer si le serveur MID dispose de suffisamment de ressources de mémoire. Cette mesure est un pourcentage de la mémoire maximale utilisée par rapport à la mémoire totale disponible. La tendance dans le temps fournit une visualisation de la quantité de mémoire requise par le serveur MID.