Mesures de Linux

  • Rversion finale: Xanadu
  • Mis à jour 1 août 2024
  • 10 minutes de lecture
  • Le tableau suivant répertorie les mesures collectées résultant de l'exécution de vérifications Linux. Les entrées indiquées comme des mesures présentées sont des mesures de visibilité élevée qui sont affichées dans l'onglet Espace de travail de l'opérateur Metric (Mesures d'espace de travail) après qu'une alerte a été générée. Ces mesures fournissent à l'opérateur des informations supplémentaires pour l'aider à approfondir la question.

    Tableau 1. Mesures os.linux.metrics-process-usage
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    proc.acc.running Nombre de processus en cours d'exécution avec ce nom (acc).
    proc.acc.cpuPercent Pourcentage de processeurs pris par le processus.
    proc.acc.memPercent Pourcentage de mémoire prise par le processus.
    Tableau 2. Mesures os.linux.metrics-reboot-count-today
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    reboot.count.today Nombre de redémarrages aujourd'hui.
    Tableau 3. Mesures os.linux.metrics-system-cpu
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    cpu.total.user Processus normaux exécutés en mode utilisateur ; cpu.total.user est le total des mesures cpuN.user.
    cpu.total.nice Processus optimisés s’exécutant en mode utilisateur ; cpu.total.nice est le total des cpuN.nice mesures.
    cpu.total.system Temps passé par le processeur à exécuter le noyau ; cpu.total.system est le total des mesures cpuN.system.
    cpu.total.idle Temps total passé par le processeur à l'état inactif ; cpu.total.idle est le total des mesures cpuN.idle.
    cpu.total.iowait Temps total que le processeur a passé à attendre que les opérations d'E/S se terminent ; cpu.total.iowait est le total des mesures cpuN.iowait.
    cpu.total.irq Temps total que le processeur consacre aux interruptions ; cpu.total.irq est le total des mesures cpuN.irq.
    cpu.total.softirq Temps passé à servir des demandes d'interruptions intangibles ; cpu.total.softirq est le total des mesures cpuN.softirq.
    cpu.total.steal Temps total passé par le processeur virtuel à attendre que l'hyperviseur serve un autre processeur virtuel. S'applique uniquement aux ordinateurs virtuels.
    cpu.total.guest Temps total passé par le processeur à exécuter le processeur virtuel. S'applique uniquement aux hyperviseurs.
    cpu.total.guest_nice Temps total passé par le processeur à s'exécuter en tant que système d'exploitation invité opérationnel ; cpu.total.guset_nice est le total des mesures cpuN.guest_nice.
    cpu.<cpu-core>.user Temps passé avec un traitement normal en mode utilisateur.
    cpu.<cpu-core>.nice Temps passé avec le traitement opérationnel en mode utilisateur.
    cpu.<cpu-core>.system Temps passé à s'exécuter en mode noyau.
    cpu.<cpu-core>.idle Temps passé en mode inactif.
    cpu.<cpu-core>.iowait Temps passé à attendre la fin des E/S. Également considéré comme temps d'inactivité.
    cpu.<cpu-core>.irq Temps passé à servir des interruptions matérielles.
    cpu.<cpu-core>.softirq Temps passé à servir des interruptions logicielles.
    cpu.<cpu-core>.steal Temps volé par d'autres systèmes d'exploitation exécutés dans un environnement virtuel.
    cpu.<cpu-core>.guest Temps passé à exécuter un processeur virtuel ou un système d'exploitation invité sous le contrôle du noyau.
    cpu.<cpu-core>.guest_nice Temps total passé par le processeur à exécuter en tant que système d'exploitation invité opérationnel.
    cpu.intr Interruptions de service depuis l'heure de démarrage.
    cpu.ctxt Nombre total de commutateurs de contexte entre tous les processeurs.
    cpu.btime Heure de démarrage.
    cpu.processes Nombre de processus et de threads créés, qui incluent (sans toutefois s'y limiter) ceux créés par les appels système fork() et clone().
    cpu.procs_running Nombre total de processus en cours d'exécution sur tous les processeurs.
    cpu.procs_blocked Nombre de processus actuellement bloqués et en attente de la fin des E/S.
    cpu.cpu_count Nombre de processeurs dans le système.
    cpu.<cpu-core>.cores Nombre de cœurs de processeur.
    Tableau 4. Mesures os.linux.metrics-system-cpu-load
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    load_avg.one (mesure présentée) Charge moyenne du système sur une minute.
    load_avg.five (mesure présentée) Charge moyenne du système sur cinq minutes.
    load_avg.fifteen (mesure présentée) Charge moyenne du système sur quinze minutes.
    load_avg.norm.one Charge moyenne du système sur une minute normalisée par le nombre de processeurs.
    load_avg.norm.five Charge moyenne du système sur cinq minutes normalisée par le nombre de processeurs.
    load_avg.norm.fifteen Charge moyenne du système sur quinze minutes normalisée par le nombre de processeurs.
    Tableau 5. Mesures os.linux.metrics-system-cpu-percentage
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    cpu.avgutilization_percentage Pourcentage moyen d'utilisation du processeur.
    cpu.user_percentage (mesure présentée) Pourcentage de temps total d'utilisation du processeur par les processus normaux en mode utilisateur.
    cpu.nice_percentage (mesure présentée) Pourcentage de temps d'utilisation de tous les processeurs par les processus opérationnels en mode utilisateur.
    cpu.system_percentage (mesure présentée) Pourcentage de temps passé par le processeur à exécuter le noyau.
    cpu.idle_percentage (mesure présentée) Pourcentage de temps pendant lequel tous les IPCU étaient inactifs.
    cpu.iowait_percentage (mesure présentée) Pourcentage de temps pendant lequel tous les processeurs ont attendu la fin des E/S.
    cpu.irq_percentage (mesure présentée) Pourcentage de temps pendant lequel toutes les interruptions de service de processeurs ont été exécutées.
    cpu.softirq_percentage (mesure présentée) Pourcentage de temps pendant lequel tous les CI ont réparé des interruptions logicielles.
    cpu.steal_percentage (mesure présentée) Pourcentage de temps pendant lequel tous les processeurs ont réparé des systèmes d'exploitation hôtes virtuels.
    cpu.guest_percentage (mesure présentée) Pourcentage de temps pendant lequel tous les processeurs ont réparé des systèmes d'exploitation invités.
    Tableau 6. Mesures os.linux.metrics-system-disk
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    disk.<nom-disque>.reads (mesure présentée) Nombre total de lectures correctement terminées.
    disk.<nom-disque>.readsMerged Nombre total de lectures fusionnées.
    disk.<nom-disque>.sectorsRead Nombre total de secteurs correctement lus.
    disk.<nom-disque>.readTime millisecondes Nombre total de millisecondes passées sur toutes les lectures.
    disk.<nom-disque>.writes (mesure présentée) Nombre total d'écritures correctement terminées.
    disk.<nom-disque>.writesMerged Nombre total d'écritures fusionnées.
    disk.<nom-disque>.sectorsWritten Nombre total de secteurs correctement écrits.
    disk.<nom-disque>.writeTime millisecondes Nombre total de millisecondes passées sur toutes les écritures.
    disk.<nom-disque>.ioInProgress Nombre total d'E/S actuellement en cours.
    disk.<nom-disque>.ioTime (mesure présentée) Temps total consacré aux E/S.
    disk.<nom-disque>.ioTimeWeighted Temps total consacré aux E/S. Cela peut fournir une mesure du délai d'exécution des E/S et du backlog qui pourrait s'accumuler.
    Tableau 7. Mesures os.linux.metrics-system-disk-capacity
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    disk.<file-system-name>.total Taille totale du système de fichiers.
    disk.<file-system-name>.used Quantité totale d'espace alloué aux fichiers existants dans le système de fichiers.
    disk.<file-system-name>.avail Quantité totale d'espace disponible dans le système de fichiers.
    disk.<file-system-name>.used_percentage Pourcentage d'espace disponible actuellement alloué à tous les fichiers du système de fichiers.
    disk.<file-system-name>.itotal Nombre total d'inodes sur le système de fichiers.
    disk.<file-system-name>.iused Nombre d'inodes utilisés.
    disk.<file-system-name>.iavail Nombre d'inodes libres (non utilisés).
    disk.<file-system-name>.iused_percentage Pourcentage d'inodes utilisés.
    Tableau 8. Mesures os.linux.metrics-system-disk-usage
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    disk_usage.<disque>.total Quantité totale d'espace disponible sur le disque.
    disk_usage.<disque>.used Quantité totale d'espace utilisé dans le disque.
    disk_usage.<disque>.avail Quantité totale d'espace disponible sur le disque.
    disk_usage.<disque>.used_percentage (mesure présentée) Pourcentage d'espace utilisé sur le disque.
    Tableau 9. Mesures os.linux.metrics-system-memory
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    memory.total Mémoire RAM utilisable totale.
    memory.free Mémoire RAM gratuite totale.
    memory.available Estimation de la quantité de mémoire disponible pour le démarrage de nouvelles applications sans échange.
    memory.buffers Stockage temporaire utilisé pour les blocs de disque bruts.
    memory.cached Cache en mémoire pour les fichiers lus à partir du disque (cache de la page). N'inclut pas mem_swapcached.
    memory.swapTotal (mesure présentée) Quantité totale d'espace d'échange disponible.
    memory.swapFree (mesure présentée) Quantité d'espace d'échange actuellement inutilisé.
    memory.dirty Mémoire qui attend d'être écrite dans le disque.
    memory.swapUsed (mesure présentée) Quantité d'espace d'échange en cours d'utilisation.
    memory.used Quantité de mémoire RAM utilisée.
    memory.usedWOBuffersCaches Quantité de mémoire utilisée.
    memory.freeWOBuffersCaches Valeur MemAvailable de /proc/meminfo , le cas échéant, mais équivalente à libre + en mémoire tampon + mémoire mise en cache si elle n'est pas présente.
    memory.swapUsedPercentage Pourcentage d'espace d'échange utilisé.
    Tableau 10. Mesures os.linux.metrics-system-memory-percent
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    memory_percent.free (mesure présentée) Pourcentage de RAM libre.
    memory_percent.available (mesure présentée) Pourcentage de mémoire disponible
    memory_percent.buffers (mesure présentée) Pourcentage de mémoire utilisée pour les blocs de disque bruts.
    memory_percent.cached (mesure présentée) Pourcentage de mémoire utilisée avec le cache en mémoire pour les fichiers lus à partir du disque.
    memory_percent.dirty (mesure présentée) Pourcentage de mémoire en attente d'écriture sur le disque.
    memory_percent.swapUsed (mesure présentée) Pourcentage d'espace d'échange utilisé.
    memory_percent.usedWOBuffersCaches (mesure présentée) Pourcentage de mémoire utilisée.
    memory_percent.freeWOBuffersCaches (mesure présentée) Pourcentage de mémoire disponible.
    Tableau 11. Mesures os.linux.metrics-system-uptime
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    system.uptime(sec) Durée d'activité et de disponibilité du système.
    Tableau 12. Mesures os.linux.metrics-memory-vmstat
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    vmstat.nr_free_pages Pages actuellement inutilisées par le système.
    vmstat.nr_alloc_batch Pages allouées à d'autres domaines en raison d'une mémoire insuffisante dans chaque domaine de chaque nœud d'accès à la mémoire non uniforme (NUMA).
    vmstat.nr_inactive_anon Pages de mémoire dans chaque domaine de chaque nœud NUMA qui n'ont pas été consultées.
    vmstat.nr_active_anon Pages de mémoire virtuelle anonymes qui ont été utilisées récemment.
    vmstat.nr_inactive_file Page de mémoire correspondant au fichier qui n'a pas été consulté dans chaque domaine de chaque NUMA.
    vmstat.nr_active_file Page de mémoire correspondant au fichier qui a été récemment consulté.
    vmstat.nr_unevictable Nombre de pages dans la liste (non-)LRU instable.
    vmstat.nr_mlock Pages mappées dans un VMA VM_LOCKED qui sont une classe de pages instables.
    vmstat.nr_anon_pages Pages mappées de mémoire qui ne font pas partie d'un fichier.
    vmstat.nr_mapped Nombre de pages mappées de mémoire.
    vmstat.nr_file_pages
    vmstat.nr_dirty Pages en attente d'écriture sur le disque.
    vmstat.nr_writeback Pages actuellement écrites sur le disque.
    vmstat.nr_slab_reclaimable Pages de l'utilisation de la mémoire de section de noyau pouvant être récupérées.
    vmstat.nr_slab_unreclaimable Pages de l'utilisation de la mémoire de section de noyau impossibles à récupérer.
    vmstat.nr_page_table_pages Pages allouées aux tables de pages.
    vmstat.nr_kernel_stack Quantité de mémoire allouée aux piles de noyau.
    vmstat.nr_unstable Nombre de pages instables dans chaque domaine de chaque nœud NUMA.
    vmstat.nr_bounce
    vmstat.nr_vmscan_write Nombre de pages de modifications écrites lors d'une analyse de LRU.
    vmstat.nr_vmscan_immediate_reclaim
    vmstat.nr_writeback_temp
    vmstat.nr_isolated_anon Nombre de pages de mémoire anonyme isolées dans chaque domaine de chaque nœud NUMA.
    vmstat.nr_isolated_file Nombre de pages de stockage de fichiers isolées dans chaque domaine de chaque nœud NUMA.
    vmstat.nr_shmem Nombre de pages de mémoire partagée.
    vmstat.nr_dirtied Nombre de pages erronées dans chaque domaine de chaque nœud NUMA.
    vmstat.nr_written
    vmstat.numa_hit Nombre de pages qui ont été correctement allouées à ce nœud.
    vmstat.numa_miss Nombre de pages allouées à ce nœud en raison d'une mémoire faible sur le nœud souhaité.
    vmstat.numa_foreign Nombre de pages initialement destinées à ce nœud qui ont été allouées à un autre nœud.
    vmstat.numa_interleave Nombre de pages de politique d'entrelacement correctement allouées à ce nœud.
    vmstat.numa_local Nombre de pages correctement allouées sur ce nœud par un processus sur ce nœud.
    vmstat.numa_other Nombre de pages allouées sur ce nœud par un processus sur un autre nœud.
    vmstat.workingset_refault
    vmstat.workingset_activate
    vmstat.workingset_nodereclaim
    vmstat.nr_anon_transparent_hugepages
    vmstat.nr_free_cma Pages d'allocation de mémoire continue libre dans chaque domaine de chaque NUMA.
    vmstat.nr_dirty_threshold
    vmstat.nr_dirty_background_threshold
    vmstat.pgpgin Nombre de pages apportées à partir du disque.
    vmstat.pgpgout Nombre de pages écrites sur le disque.
    vmstat.pswpin Nombre de pages apportées à partir de l'espace d'échange.
    vmstat.pswpout Nombre de pages échangées dans l'espace d'échange.
    vmstat.pgalloc_dma
    vmstat.pgalloc_dma32
    vmstat.pgalloc_normal
    vmstat.pgalloc_movable
    vmstat.pgfree Nombre de pages libres depuis le dernier démarrage.
    vmstat.pgactivate Nombre d'activations de pages depuis le dernier démarrage.
    vmstat.pgdeactivate Nombre de désactivations de page depuis le dernier démarrage.
    vmstat.pgfault Pannes mineures depuis le dernier démarrage.
    vmstat.pgmajfault Pannes majeures depuis le dernier démarrage.
    vmstat.pglazyfreed
    vmstat.pgrefill_dma
    vmstat.pgrefill_dma32
    vmstat.pgrefill_normal Nombre de remplissages de pages depuis le dernier démarrage.
    vmstat.pgrefill_movable
    vmstat.pgsteal_kswapd_dma
    vmstat.pgsteal_kswapd_dma32
    vmstat.pgsteal_kswapd_normal
    vmstat.pgsteal_kswapd_movable
    vmstat.pgsteal_direct_dma
    vmstat.pgsteal_direct_dma32
    vmstat.pgsteal_direct_normal
    vmstat.pgsteal_direct_movable
    vmstat.pgscan_kswapd_dma
    vmstat.pgscan_kswapd_dma32
    vmstat.pgscan_kswapd_normal Nombre de pages analysées par kswapd depuis le démarrage.
    vmstat.pgscan_kswapd_movable
    vmstat.pgscan_direct_dma
    vmstat.pgscan_direct_dma32
    vmstat.pgscan_direct_normal Nombre de pages récupérées depuis le démarrage.
    vmstat.pgscan_direct_movable
    vmstat.pgscan_direct_throttle
    vmstat.zone_reclaim_failed
    vmstat.pginodesteal
    vmstat.slabs_scanned
    vmstat.kswapd_inodesteal
    vmstat.kswapd_low_wmark_hit_quickly
    vmstat.kswapd_high_wmark_hit_quickly
    vmstat.pageoutrun Nombre de fois où kswapd a appelé la récupération de pages.
    vmstat.allocstall Nombre de fois où la récupération de pages a été appelée directement (mémoire faible).
    vmstat.pgrotated
    vmstat.drop_pagecache
    vmstat.drop_slab
    vmstat.numa_pte_updates
    vmstat.numa_huge_pte_updates
    vmstat.numa_hint_faults
    vmstat.numa_hint_faults_local
    vmstat.numa_pages_migrated
    vmstat.pgmigrate_success
    vmstat.pgmigrate_fail
    vmstat.compact_migrate_scanned
    vmstat.compact_free_scanned
    vmstat.compact_isolated
    vmstat.compact_stall Nombre de fois qu'un processus se bloque lors de l'exécution du compactage de mémoire pour libérer une page volumineuse en vue de l'utiliser.
    vmstat.compact_fail Nombre de fois où le système a tenté de compacter la mémoire, mais a échoué.
    vmstat.compact_success Nombre de fois où le système a compacté la mémoire et a libéré une page volumineuse en vue de l'utiliser.
    vmstat.htlb_buddy_alloc_success
    vmstat.htlb_buddy_alloc_fail
    vmstat.unevictable_pgs_culled
    vmstat.unevictable_pgs_scanned
    vmstat.unevictable_pgs_rescued
    vmstat.unevictable_pgs_mlocked
    vmstat.unevictable_pgs_munlocked
    vmstat.unevictable_pgs_cleared
    vmstat.unevictable_pgs_stranded
    vmstat.thp_fault_alloc Nombre de pages volumineuses correctement allouées pour gérer un défaut de page.
    vmstat.thp_fault_fallback Nombre de fois qu'un défaut de page ne parvient pas à allouer une page volumineuse avant de revenir à l'utilisation de pages moins volumineuses.
    vmstat.thp_collapse_alloc Nombre de pages réduites en une seule page volumineuse avec allocation réussie d'une nouvelle page volumineuse pour stocker les données.
    vmstat.thp_collapse_alloc_failed Nombre de pages réduites en une page volumineuse, mais dont l'allocation a échoué.
    vmstat.thp_split Nombre de pages de base à diviser à partir d'une page volumineuse.
    vmstat.thp_zero_page_alloc Nombre d'allocations réussies de pages de zéros volumineuses.
    vmstat.thp_zero_page_alloc_failed Nombre de fois où le noyau n'a pas alloué une page de zéros volumineuse et repasse à l'utilisation de pages moins volumineuses.
    vmstat.balloon_inflate
    vmstat.balloon_deflate
    vmstat.balloon_migrate
    Tableau 13. Mesures os.linux.metrics-process-status
    Type de mesure Ressource (nom de la base de données spécifique, le cas échéant) Unités Description du type de mesure
    proc.<process>.VmSize Quantité totale de mémoire virtuelle utilisée par le processus.
    proc.<process>.VmRSS Mémoire physique non échangée utilisée par un processus.
    proc.<process>.VmSwap Quantité totale d'espace d'échange utilisée.