Linux verificações e políticas padrão
Agent Client Collector fornece as seguintes verificações e políticas padrão para Linux Monitoramento de métricas.
Verificações de métricas de monitoramento do Linux
| Verificação | Nome de métrica | Recurso | Descrição | Unidades | Métrica em destaque | Detecção de Anomalia |
|---|---|---|---|---|---|---|
| os.linux.metrics-process-usage | proc.acc.running | nome-do-processo | Número de processos em execução com este nome (acc) | contagem | ||
| acc.cpuPercent.cpuPercent | nome-do-processo | Percentual de cpu usada pelo processo. | porcentagem | |||
MemPercent. acc. Do proc |
nome-do-processo | Percentual de memória usada pelo processo. | porcentagem | |||
| os.linux.metrics-reinicit-count-today | reboot.count.today | vazio | Número de reinicializações concluídas em hoje | contagem | ||
| .linux.metrics-system-cpu | cpu.total.user | total | Processos normais em execução no modo de usuário; cpu.total.user é o total das cpuN.user métricas. | contagem | ||
| cpu.total.nice | total | Processos Niced em execução no modo de usuário; cpu.total.nice é o total das métricas cpuN.nice. | contagem | |||
| cpu.total.sistema | total | Tempo que a CPU gastou executando o kernel; cpu.total.system é o total das métricas cpuN.system. | seg | |||
| cpu.total.ocioso | total | Tempo total que a CPU gastou em um estado ocioso.; cpu.total.idle é o total das métricas cpuN.idle. | seg | |||
| cpu.total.iowait | total | Tempo total que a CPU gastou aguardando a conclusão das operações de E/S; cpu.total.iowait é o total das métricas cpuN.iowait. | seg | |||
| irq.total.cpu | total | Tempo total gasto pelo processador no tratamento de interrupções. cpu.total.irq é o total das métricas cpuN.irq. | seg | |||
| cpu.total.softirq | total | Tempo gasto na manutenção de solicitações de interrupção de software; cpu.total.softirq é o total das métricas cpuN.softirq. | seg | |||
| cpu.total.roubar | total | Tempo total que a CPU virtual gastou aguardando o hipervisor atender a outra CPU virtual. Aplica-se somente a máquinas virtuais. | seg | |||
| cpu.total.convidado | total | Tempo total que a CPU gastou executando o processador virtual. Aplica-se somente a hipervisores. | seg | |||
| cpu.total.guest_nice | total | Tempo total que a CPU gastou em execução como SO convidado agradável. cpu.total.guset_nice si O total das métricas cpuN.guest_nice | seg | |||
| cpu.<cpu-core>.user | cpu-núcleo | Tempo gasto com processamento normal no modo de usuário. | seg | |||
| cpu.<cpu-core>.nice | cpu-núcleo | Tempo gasto com processos niced no modo de usuário. | seg | |||
| cpu.<cpu-core>.system | cpu-núcleo | Tempo gasto em execução no modo kernel. | seg | |||
| cpu.<cpu-core>.idle | cpu-núcleo | Tempo gasto em férias girando polegares. | seg | |||
| cpu.<cpu-core>.iowait | cpu-núcleo | Tempo gasto aguardando a conclusão do I/O. Este também é considerado tempo ocioso. | seg | |||
| cpu.irq.<cpu-core> | cpu-núcleo | Tempo gasto servindo interrupções de hardware. | seg | |||
| cpu.<cpu-core>.softirq | cpu-núcleo | Tempo gasto servindo interrupções de software. | seg | |||
| cpu.<cpu-core>.roubar | cpu-núcleo | Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual. | seg | |||
| cpu.<cpu-core>.convidado | cpu-núcleo | Tempo gasto para executar uma CPU virtual ou SO convidado sob o controle do kernel. | seg | |||
| cpu.<cpu-core>.guest_nice | cpu-núcleo | Tempo total que a CPU gastou em execução como SO convidado agradável. | seg | |||
| cpu.intr | vazio | Interrompe o serviço desde o momento da inicialização. | seg | |||
| cpu.ctt | vazio | Número total de comutadores de contexto em todas as CPUs. | contagem | |||
| cpu.btime | vazio | A hora em que o sistema foi inicializado | seg | |||
| cpu.processes | vazio | O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas do sistema fork() e clone(). | contagem | |||
| cpu.procs_running | vazio | O número total de processos em execução em todas as CPUs. | contagem | |||
| cpu.procs_blocked | vazio | O número de processos bloqueados no momento, aguardando a conclusão do I/O. | contagem | |||
| cpu.cpu_count | vazio | Número de cpu no sistema | contagem | |||
| cpu.<cpu-core>.cores | cpu-núcleo | O número de núcleos de CPU | contagem de núcleos | |||
| .linux.metrics-system-cpu-load | load_avg.one | vazio | A carga média do sistema durante um minuto. | contagem de threads | sim | sim |
| load_avg.five | vazio | A carga média do sistema durante cinco minutos. | contagem de threads | sim | sim | |
| load_avg.quinze | vazio | A carga média do sistema ao longo de quinze minutos. | contagem de threads | sim | sim | |
| load_avg.norm.one | vazio | A carga média do sistema durante um minuto normalizada pelo número de CPUs. | contagem de threads | |||
| load_avg.norm.five | vazio | A carga média do sistema durante cinco minutos normalizada pelo número de CPUs. | contagem de threads | |||
| load_avg.norm.fifteen | vazio | A carga média do sistema durante quinze minutos normalizada pelo número de CPUs. | contagem de threads | |||
| .linux.metrics-system-cpu-percentage | percentual de cpu.avgutilization_ | vazio | Porcentagem de cpu usada em média | porcentagem | ||
| percentual de cpu.user_ | vazio | Percentual de tempo que a cpu total foi usada por processos normais no modo de usuário | porcentagem | sim | sim | |
| percentual de cpu.nice_ | vazio | Percentual de tempo em todas as cpus usadas por processos niced no modo de usuário | porcentagem | sim | sim | |
percentual de cpu.system_ |
vazio | A porcentagem de tempo que a CPU gastou executando o kernel. | porcentagem | sim | sim | |
| cpu.idle_percentage | vazio | Percentual de tempo em que todas as cpus estavam ociosas | porcentagem | sim | sim | |
percentual de cpu.iowait_ |
vazio | Percentual de tempo em que todas as cpus aguardam a conclusão de E/S | porcentagem | sim | sim | |
| cpu.irq_percentage | vazio | Percentual de tempo em que todas as cpus que atendem são interrompidas | porcentagem | sim | sim | |
percentual de cpu.softirq_ |
vazio | Percentual de tempo em que todas as cpus que atendem a interrupções de software | porcentagem | sim | sim | |
| percentual de cpu.steal_ | vazio | Percentual de tempo em que todas as cpus atenderam aos sistemas operacionais de hosts virtuais | porcentagem | sim | sim | |
| percentual de cpu.guest_ | vazio | Percentual de tempo em que todas as cpus atenderam ao sistema operacional convidado | porcentagem | sim | sim | |
| os.linux.metrics-system-disk | disk.<disk-name>.reads | nome do disco | Número total de leituras concluídas com sucesso. | contagem | sim | sim |
| Disk.<disk-name>.readsMerged | nome do disco | Número total de leituras mescladas | contagem | |||
| Disk.<disk-name>.sectorsRead | nome do disco | Número total de setores lidos com sucesso. | contagem | |||
| Disk.<disk-name>.ReadTime | nome do disco | Número total de milissegundos gastos por todas as leituras. | milissegundos | |||
| disk.<disk-name>.writes | nome do disco | Número total de gravações concluídas com sucesso. | contagem | sim | sim | |
| Disk.<disk-name>.writesMerged | nome do disco | Número total de gravações mescladas | contagem | |||
| Disk.<disk-name>.sectorsWritten | nome do disco | Número total de setores gravados com sucesso. | contagem | |||
| Disk.<disk-name>.writeTime | nome do disco | Número total de milissegundos gastos por todas as gravações. | misllisec | |||
| Disk.<disk-name>.ioEm andamento | nome do disco | Número total de E/Ss em andamento no momento | contagem | |||
| Disk.<disk-name>.ioTime | Tempo total gasto fazendo E/Ss | milissegundos | sim | sim | ||
| Disk.<disk-name>.ioTimeWeighted | nome do disco | Tempo total gasto fazendo E/Ss. Isso pode fornecer uma medida fácil do tempo de conclusão de E/S e do backlog que pode estar se acumulando. | milissegundos | |||
| os.linux.metrics-system-disk-capacity | total.disk.<file-system-name> | nome do sistema de arquivos | O tamanho total do sistema de arquivos. | byte | ||
| disk.<file-system-name>.usado | nome do sistema de arquivos | A quantidade total de espaço alocada para arquivos existentes no sistema de arquivos. | byte | |||
| disk.<file-system-name>.avail | nome do sistema de arquivos | A quantidade total de espaço disponível no sistema de arquivos. | byte | |||
| disk.<file-system-name>.used_percentage | nome do sistema de arquivos | A porcentagem do espaço disponível atualmente alocado para todos os arquivos no sistema de arquivos. | porcentagem | |||
| disk.<file-system-name>.itotal | nome do sistema de arquivos | O número total de inodes no sistema de arquivos. | contagem | |||
| disk.<file-system-name>.iused | nome do sistema de arquivos | O número de inodes usados. | contagem | |||
| disk.<file-system-name>.iavail | nome do sistema de arquivos | O número de inodes livres (não utilizados). | contagem | |||
| disk.<file-system-name>.iused_percentage | nome do sistema de arquivos | A porcentagem de inodes usados. | porcentagem | |||
| os.linux.metrics-system-disk-usage | disk_usage.<disk>.total | nome do disco | Quantidade total de espaço disponível neste disco | bytes | ||
| disk_usage.<disk>.used | nome do disco | Quantidade total de espaço usado neste disco | bytes | |||
| disk_usage.<disk>.avail | nome do disco | Quantidade total de espaço disponível neste disco | bytes | |||
| disk_usage.<disk>.used_percentagem | nome do disco | A porcentagem de espaço usado neste disco | porcentagem | sim | sim | |
| linux.metrics-system-meoryos.linux.metrics-system- memory-percent | memória.total | vazio | RAM utilizável total. | Base de conhecimento | ||
| memory.free | vazio | RAM livre total. | Base de conhecimento | |||
| memória.disponível | vazio | Uma estimativa da quantidade de memória disponível para iniciar novas aplicações, sem troca. | Base de conhecimento | |||
| memory.buffers | vazio | Armazenamento temporário usado para blocos de disco brutos. | Base de conhecimento | |||
| memory.cached | vazio | Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached. | Base de conhecimento | |||
| Memory.swapTotal | vazio | Quantidade total de espaço de troca disponível. | Base de conhecimento | sim | sim | |
| Memória.SwapFree | vazio | Quantidade de espaço de troca que não é usada no momento. | sim | sim | ||
| memória.suja | vazio | Memória que está aguardando para ser gravada de volta no disco. | Base de conhecimento | |||
| Memória.swapUsada | vazio | A quantidade de espaço de troca em uso. | Base de conhecimento | sim | sim | |
| memory.used | vazio | A quantidade de RAM em uso. | Base de conhecimento | |||
| memória. UsedWOBuffersCaches | vazio | A quantidade de memória em uso. | Base de conhecimento | |||
| memória. WOBuffersCaches | vazio | Valor de MemAvailable de /proc/meminfo se presente, mas fallback para adicionar memória livre, armazenada em buffer e armazenada em cache, caso contrário. | Base de conhecimento | |||
| memória. SwapUsedPercentage | vazio | Percentual do espaço de troca usado. | porcentagem | |||
| memory_percent. livre | vazio | Percentual de RAM livre | porcentagem | sim | sim | |
| memory_percent. disponível | vazio | Percentual de memória disponível | porcentagem | sim | sim | |
| memory_percent. buffers | vazio | Memória usada para blocos de disco brutos | porcentagem | sim | sim | |
| memory_percent. armazenado em cache | vazio | Percentual de memória usada para cache na memória para arquivos lidos do disco | porcentagem | sim | sim | |
| memory_percent. sujo | vazio | Percentual de memória aguardando para ser gravada de volta no disco. | porcentagem | sim | sim | |
| memory_percent. Trocado | vazio | Percentual do espaço de troca usado. | porcentagem | sim | sim | |
| memory_percent. UsedWOBuffersCaches | vazio | Percentual de memória em uso | porcentagem | sim | sim | |
| memory_percent. WOBuffersCaches | vazio | Percentual de memória disponível | porcentagem | sim | sim | |
| linux.metrics-tempo de atividade do sistema | tempo de atividade do sistema (seg) | vazio | A quantidade de tempo que o sistema está funcionando e disponível. | seg | ||
| os.linux.metrics-memory-vmstat | vmstat.nr_free_pages | vazio | Páginas que não são utilizadas no momento pelo sistema. | páginas | ||
| vmstat.nr_alloc_batch | vazio | Páginas alocadas para outros domínios devido à memória insuficiente em cada domínio de cada NUMA | páginas | |||
| vmstat.nr_inactive_eon | vazio | Páginas de memória em cada domínio de cada nó NUMA que não foram acessadas por um longo período | páginas | |||
| vmstat.nr_active_eon | vazio | Páginas de memória virtual anônimas que foram usadas recentemente | Base de conhecimento | |||
| arquivo vmstat.nr_inactive_ | vazio | A página de memória correspondente ao arquivo que não foi acessado por um longo período em cada domínio de cada NUMA. | Base de conhecimento | |||
| arquivo vmstat.nr_active_ | vazio | A página de memória correspondente ao arquivo que foi acessado recentemente . | páginas | |||
| vmstat.nr_unevictable | vazio | O número de páginas está na lista (não) LRU não removivecível | contagem | |||
| vmstat.nr_mlock | vazio | Páginas mapeadas em um VMA vm_LOCKED - são uma classe de páginas não removecíveis. | páginas | |||
| páginas vmstat.nr_eon_ | vazio | Páginas mapeadas na memória que não fazem parte de um arquivo. | páginas | |||
| vmstat.nr_mapeado | vazio | O número de páginas mapeadas na memória. | contagem | |||
| vmstat.nr_file_páginas | vazio | |||||
| vmstat.nr_sujo | vazio | Páginas aguardando gravação no disco | páginas | |||
| write-back de vmstat.nr_ | vazio | Páginas sendo gravadas no disco no momento | páginas | |||
| vmstat.nr_slab_recuperável | vazio | Páginas do uso de memória da placa do kernel que podem ser recuperadas | páginas | |||
| vmstat.nr_slab_não recuperável | vazio | Páginas do uso de memória da placa do kernel que não podem ser recuperadas | páginas | |||
| vmstat.nr_page_table_pages | vazio | Páginas alocadas para tabelas de páginas | páginas | |||
| stack vmstat.nr_kernel_ | vazio | Quantidade de memória alocada para pilhas de kernel. | Base de conhecimento | |||
| vmstat.nr_unstable | vazio | O número de páginas instáveis em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_bounce | vazio | |||||
| vmstat.nr_vmscan_write | vazio | O número de páginas incorretas gravadas durante uma verificação de LRU(s) | contagem | |||
| vmstat.nr_vmscan_immediate_reclaim | vazio | |||||
| vmstat.nr_writeback_temp. | vazio | |||||
| vmstat.nr_isolated_eon | vazio | O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_isolated_file | vazio | O número de páginas de páginas de armazenamento de arquivos isoladas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_shmem | vazio | O número de páginas de memória compartilhada | contagem | |||
| vmstat.nr_dirtied | vazio | O número de páginas sujas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_written | vazio | |||||
| vmstat.numa_hit | vazio | O número de páginas que foram alocadas com sucesso para este nó. | contagem | |||
| vmstat.numa_miss | vazio | O número de páginas que foram alocadas neste nó devido à pouca memória no nó pretendido. | contagem | |||
| vmstat.numa_foreign | vazio | O número de páginas inicialmente destinadas a este nó que foram alocadas para outro nó. | contagem | |||
| interleave vmstat.numa_ | vazio | O número de páginas de política intercaladas alocadas com sucesso para este nó. | contagem | |||
| vmstat.numa_local | vazio | O número de páginas alocadas com sucesso neste nó por um processo neste nó | contagem | |||
| vmstat.numa_other | vazio | O número de páginas alocadas neste nó, por um processo em outro nó. | contagem | |||
| vmstat.workingset_padrão | vazio | |||||
| vmstat.workingset_activate | vazio | |||||
| vmstat.workingset_noderecuperar | vazio | |||||
| vmstat.nr_eon_transparent_hugepages | vazio | |||||
| vmstat.nr_free_cma | vazio | Páginas de alocador de memória contínua gratuitas em cada domínio de cada NUMA | ||||
| limite de vmstat.nr_dirty_ | vazio | |||||
| vmstat.nr_dirty_background_threshold | vazio | |||||
| vmstat.pgpgin | vazio | O número de páginas obtidas do disco | contagem | |||
| vmstat.pgpgout | vazio | O número de páginas gravadas no disco | contagem | |||
| vmstat.pswpin | vazio | O número de páginas trazidos do espaço de troca | contagem | |||
| vmstat.pswpout | vazio | O número de páginas trocadas no espaço de troca | contagem | |||
| vmstat.pgalloc_dma | vazio | |||||
| vmstat.pgalloc_dma32 | vazio | |||||
| vmstat.pgalloc_normal | vazio | |||||
| vmstat.pgalloc_ movable | vazio | |||||
| vmstat.pgfree | vazio | O número de páginas está livre desde a última inicialização | contagem | |||
| vmstat.pgactivat | vazio | Número de ativações de página desde a última inicialização | contagem | |||
| vmstat.pgdesativar | vazio | Número de desativações de página desde a última inicialização | contagem | |||
| vmstat.pgdefault | vazio | Falhas secundárias desde a última inicialização | páginas | |||
| vmstat.pgmajdefault | vazio | Falhas graves desde a última inicialização | páginas | |||
| vmstat.pglazyfreed | vazio | |||||
| vmstat.pgrefill_dma | vazio | |||||
| vmstat.pgrefill_dma32 | vazio | |||||
| vmstat.pgrefill_normal | vazio | Número de reabastecimentos de página desde a última inicialização | contagem | |||
| vmstat.pgrefill_movable | vazio | |||||
| vmstat.pgsteal_kswapd_dma | vazio | |||||
| vmstat.pgsteal_kswapd_dma32 | vazio | |||||
| vmstat.pgsteal_kswapd_normal | vazio | |||||
| vmstat.pgsteal_kswapd_movable | vazio | |||||
| vmstat.pgsteal_direct_dma | vazio | |||||
| vmstat.pgsteal_direct_dma32 | vazio | |||||
| vmstat.pgsteal_direct_normal | vazio | |||||
| vmstat.pgsteal_direct_movable | vazio | |||||
| vmstat.pgscan_kswapd_dma | vazio | |||||
| vmstat.pgscan_kswapd_dma32 | vazio | |||||
| vmstat.pgscan_kswapd_normal | vazio | Número de páginas verificadas pelo kswapd desde a inicialização | contagem | |||
| vmstat.pgscan_kswapd_movable | vazio | |||||
| vmstat.pgscan_direct_dma | vazio | |||||
| vmstat.pgscan_direct_dma32 | vazio | |||||
| vmstat.pgscan_direct_normal | vazio | Número de páginas recuperadas desde a inicialização | contagem | |||
| vmstat.pgscan_direct_movable | vazio | |||||
| vmstat.pgscan_direct_throttle | vazio | |||||
| vmstat.zone_reclaim_failed | vazio | |||||
| vmstat.pginodesteal | vazio | |||||
| vmstat.slabs_scan | vazio | |||||
| vmstat.kswapd_inodesteal | vazio | |||||
| vmstat.kswapd_low_wmark_hit_quickly | vazio | |||||
| vmstat.kswapd_high_wmark_hit_quickly | vazio | |||||
| vmstat.pageoutrun | vazio | Número de vezes que o kswapd chamou recuperação de página | contagem | |||
| vmstat.allocstall | vazio | Número de vezes que a recuperação de página foi chamada diretamente (pouca memória) | contagem | |||
| vmstat.pgrotated | vazio | |||||
| vmstat.drop_pagecache | vazio | |||||
| slab vmstat.drop_ | vazio | |||||
| atualizações de vmstat.numa_pte_ | vazio | |||||
| vmstat.numa_huge_pte_updates | vazio | |||||
| falhas vmstat.numa_hint_ | vazio | |||||
| vmstat.numa_hint_faults_local | vazio | |||||
| vmstat.numa_pages_migrado | vazio | |||||
| vmstat.pgmigrate_success | vazio | |||||
| vmstat.pgmigrate_fail | vazio | |||||
| vmstat.compact_migrate_scan | vazio | |||||
| vmstat.compact_free_scan | vazio | |||||
| vmstat.compact_isolado | vazio | |||||
| vmstat.compact_estolagem | vazio | O número de vezes que um processo para de executar compactação de memória para que uma página enorme fique livre para uso. | contagem | |||
| vmstat.compact_fail | vazio | O número de vezes que o sistema tenta compactar a memória, mas falhou. | contagem | |||
| vmstat.compact_sucesso | vazio | O número de vezes que o sistema compactou memória e liberou uma página enorme para uso. | contagem | |||
| vmstat.htlb_buddy_alloc_success | vazio | |||||
| vmstat.htlb_buddy_alloc_fail | vazio | |||||
| vmstat.unevictable_pgs_culled | vazio | |||||
| vmstat.unevictable_pgs_scan | vazio | |||||
| vmstat.unevictable_pgs_rescued | vazio | |||||
| vmstat.unevictable_pgs_mlocked | vazio | |||||
| vmstat.unevictable_pgs_munlocked | vazio | |||||
| vmstat.unevictable_pgs_cleareed | vazio | |||||
| vmstat.unevictable_pgs_stranded | vazio | |||||
| vmstat.thp_fault_alloc | vazio | O número de páginas grandes foi alocado com sucesso para lidar com uma falha de página. | contagem | |||
| fallback vmstat.thp_fault_ | vazio | O número de falhas de página não consegue alocar uma página enorme e, em vez disso, retorna ao uso de páginas pequenas. | contagem | |||
| vmstat.thp_collapse_alloc | vazio | O número de colapso de um intervalo de páginas em uma página enorme e, em seguida, alocação bem-sucedida de uma nova página enorme para armazenar os dados. | contagem | |||
| vmstat.thp_collapse_alloc_failed | vazio | O número de recolhimento de um intervalo de páginas em uma página enorme, mas com falha na alocação. | contagem | |||
| vmstat.thp_split | vazio | O número de divisões de uma página enorme em páginas de base | contagem | |||
| vmstat.thp_zero_page_alloc | vazio | O número de alocação bem-sucedida de uma enorme página zero | contagem | |||
| vmstat.thp_zero_page_alloc_failed | vazio | O número de vezes que o kernel falhou ao alocar uma enorme página zero e retorna a usar páginas pequenas. | contagem | |||
| vmstat.ballon_inflate | vazio | |||||
| vmstat.balão_esvaziar | vazio | |||||
| vmstat.balon_migrate | vazio | |||||
| os.linux.metrics-process-status | Proc.<process> Tamanho.VmSize.VmSize | nome-do-processo | A quantidade total de memória virtual usada pelo processo | Base de conhecimento | ||
| Proc.VmRSS.Proc.<process> | nome-do-processo | A memória física não trocada que um processo usou | Base de conhecimento | |||
| Proc.<process>.VmSwap | nome-do-processo | A quantidade total de espaço de troca usado. | Base de conhecimento |
Verificações de monitoramento de rede Linux
Nota:
Ao fazer upgrade de uma versão anterior, adicione manualmente as verificações nesta tabela à política de métricas do Linux.
| Tipo | Verificação | Descrição | Uso e exemplo de uso | Métricas coletadas | Métrica em destaque |
|---|---|---|---|---|---|
| Métrica | os.linux.metrics-network-interface | Recupera todas as métricas relacionadas à interface de rede para servidores Linux. | Uso:
Exemplo de uso: |
|
sim |
| Métrica | os.linux.metrics-netstat-tcp | Recupera métricas nos estados do soquete TCP do netstat. Útil em servidores web ou proxy de alto tráfego com um grande número de conexões TCP de curta duração chegando e indo. | Uso:
Exemplo de uso: |
|
não |