Linux のデフォルトチェックとポリシー
エージェントクライアントコレクター は、Linux メトリクスモニタリングのための以下のデフォルトのチェックとポリシーを提供します。
Linux モニタリングメトリクスのチェック
| チェック | メトリクス名 | リソース | 説明 | 単位 | 主なメトリクス | 異常検出 |
|---|---|---|---|---|---|---|
| os.linux.metrics-process-usage | proc.acc.running | process-name | この名前で実行されているプロセスの数 (acc) | count | ||
| proc.acc.cpuPercent | process-name | プロセスが使用する CPU の割合。 | パーセント | |||
proc.acc.memPercent |
process-name | プロセスが使用するメモリの割合 | パーセント | |||
| os.linux.metrics-reboot-count-today | reboot.count.today | 空 | 本日実行した再起動の数 | カウント | ||
| os.linux.metrics-system-cpu | cpu.total.user | total | ユーザーモードで実行中の通常のプロセス。cpu.total.user は cpuN.user メトリクスの合計です。 | カウント | ||
| cpu.total.nice | total | ユーザーモードで実行中の niced プロセス。cpu.total.nice は cpuN.nice メトリクスの合計です。 | カウント | |||
| cpu.total.system | total | CPU がカーネルの実行に費やした時間。cpu.total.system は cpuN.system メトリクスの合計です。 | 秒 | |||
| cpu.total.idle | total | CPU がアイドル状態であった合計時間。cpu.total.idle は cpuN.idle メトリクスの合計です。 | 秒 | |||
| cpu.total.iowait | total | CPU が IO 操作の完了を待機した合計時間。cpu.total.iowait は cpuN.iowait メトリクスの合計です。 | 秒 | |||
| cpu.total.irq | total | プロセッサーが中断の処理に費やしている合計時間。cpu.total.irq は cpuN.irq メトリクスの合計です。 | 秒 | |||
| cpu.total.softirq | total | ソフト中断要求の処理に費やされた時間。cpu.total.softirq は cpuN.softirq メトリクスの合計です。 | 秒 | |||
| cpu.total.steal | total | ハイパーバイザーが別の仮想 CPU にサービスを提供することを仮想 CPU が待機していた合計時間。仮想マシンのみに適用されます。 | 秒 | |||
| cpu.total.guest | total | CPU が仮想プロセッサーの実行に費やした合計時間。ハイパーバイザーのみに適用されます。 | 秒 | |||
| cpu.total.guest_nice | total | nice ゲスト OS として CPU が実行に費やした合計時間。cpu.total.guset_nice は cpuN.guest_nice メトリクスの合計です。 | 秒 | |||
| cpu.<cpu-core>.user | cpu_core | ユーザーモードで通常の処理にかかった時間 | 秒 | |||
| cpu.<cpu-core>.nice | cpu_core | ユーザーモードで niced プロセスにかかった時間。 | 秒 | |||
| cpu.<cpu-core>.system | cpu_core | カーネルモードで実行に費やした時間 | 秒 | |||
| cpu.<cpu-core>.idle | cpu_core | 休暇で何をするともなく費やした時間。 | 秒 | |||
| cpu.<cpu-core>.iowait | cpu_core | I/O の完了を待機して経過した時間。これもアイドル時間と見なされます。 | 秒 | |||
| cpu.<cpu-core>.irq | cpu_core | ハードウェア中断の処理に費やされた時間 | 秒 | |||
| cpu.<cpu-core>.softirq | cpu_core | ソフトウェア中断の処理に費やされた時間 | 秒 | |||
| cpu.<cpu-core>.steal | cpu_core | 仮想環境で実行されている他のオペレーティングシステムによって占有された時間 | 秒 | |||
| cpu.<cpu-core>.guest | cpu_core | カーネルの制御下で仮想 CPU またはゲスト OS の実行に費やされた時間 | 秒 | |||
| cpu.<cpu-core>.guest_nice | cpu_core | nice ゲスト OS として CPU が実行に費やした合計時間。 | 秒 | |||
| cpu.intr | 空 | ブート時以降のサービスが中断されます。 | 秒 | |||
| cpu.ctxt | 空 | すべての CPU におけるコンテキストスイッチの合計数 | カウント | |||
| cpu.btime | 空 | システムが起動した時間 | 秒 | |||
| cpu.processes | 空 | 作成されたプロセスとスレッドの数 (fork() および clone() システムコールによって作成されたプロセスとスレッドなどを含む) | カウント | |||
| cpu.procs_running | 空 | すべての CPU で実行されているプロセスの合計数 | カウント | |||
| cpu.procs_blocked | 空 | 現在ブロックされており、I/O の完了を待機しているプロセスの数 | カウント | |||
| cpu.cpu_count | 空 | システム上の CPU 数 | カウント | |||
| cpu.<cpu-core>.cores | cpu_core | CPU コアの数 | コア数 | |||
| os.linux.metrics-system-cpu-load | load_avg.one | 空 | 1 分間の平均システム負荷 | スレッド数 | はい | はい |
| load_avg.five | 空 | 5 分間の平均システム負荷 | スレッド数 | はい | はい | |
| load_avg.fifteen | 空 | 15 分間の平均システム負荷 | スレッド数 | はい | はい | |
| load_avg.norm.one | 空 | CPU の数で正規化された 1 分間の平均システム負荷 | スレッド数 | |||
| load_avg.norm.five | 空 | CPU の数で正規化された 5 分間の平均システム負荷 | スレッド数 | |||
| load_avg.norm.fifteen | 空 | CPU の数で正規化された 15 分間の平均システム負荷 | スレッド数 | |||
| os.linux.metrics-system-cpu-percentage | cpu.avgutilization_percentage | 空 | 平均で使用された CPU の割合 | パーセント | ||
| cpu.user_percentage | 空 | ユーザーモードで通常のプロセスによって使用された CPU 時間の合計に対する割合 | パーセント | はい | はい | |
| cpu.nice_percentage | 空 | ユーザーモードで niced プロセスによって使用された CPU 時間の合計に対する割合 | パーセント | はい | はい | |
cpu.system_percentage |
空 | CPU がカーネルの実行に費やした時間の割合 | パーセント | はい | はい | |
| cpu.idle_percentage | 空 | すべての CPU がアイドル状態であった時間の割合 | パーセント | はい | はい | |
cpu.iowait_percentage |
空 | すべての CPU が I/O の完了を待機した時間の割合 | パーセント | はい | はい | |
| cpu.irq_percentage | 空 | すべての CPU が中断を処理した時間の割合 | パーセント | はい | はい | |
cpu.softirq_percentage |
空 | すべての CPU がソフトウェア中断を処理した時間の割合 | パーセント | はい | はい | |
| cpu.steal_percentage | 空 | すべての CPU が仮想ホストオペレーティングシステムにサービスを提供した時間の割合 | パーセント | はい | はい | |
| cpu.guest_percentage | 空 | すべての CPU がゲストオペレーティングシステムにサービスを提供した時間の割合 | パーセント | はい | はい | |
| os.linux.metrics-system-disk | disk.<disk-name>.reads | disk-name | 正常に完了した読み取りの合計数 | カウント | はい | はい |
| disk.<disk-name>.readsMerged | disk-name | 結合された読み取りの合計数 | カウント | |||
| disk.<disk-name>.sectorsRead | disk-name | 正常に読み取られたセクターの合計数 | カウント | |||
| disk.<disk-name>.readTime | disk-name | すべての読み取りに費やされた合計ミリ秒数 | ミリ秒 | |||
| disk.<disk-name>.writes | disk-name | 正常に完了した書き込みの合計数 | カウント | はい | はい | |
| disk.<disk-name>.writesMerged | disk-name | 結合された書き込みの合計数 | カウント | |||
| disk.<disk-name>.sectorsWritten | disk-name | 正常に書き込まれたセクターの合計数 | カウント | |||
| disk.<disk-name>.writeTime | disk-name | すべての書き込みに費やされた合計ミリ秒数 | その他 | |||
| disk.<disk-name>.ioInProgress | disk-name | 現在進行中の I/O の合計数 | カウント | |||
| disk.<disk-name>.ioTime | I/O の合計所要時間。 | ミリ秒 | はい | はい | ||
| disk.<disk-name>.ioTimeWeighted | disk-name | I/O の合計所要時間。これにより、I/O 完了時間と累積する可能性のあるバックログの両方を簡単に測定できます。 | ミリ秒 | |||
| os.linux.metrics-system-disk-capacity | disk.<file-system-name>.total | file-system-name | ファイルシステムの合計サイズ | バイト | ||
| disk.<file-system-name>.used | file-system-name | ファイルシステム内の既存のファイルに割り当てられたスペースの合計量 | バイト | |||
| disk.<file-system-name>.avail | file-system-name | ファイルシステム内の利用可能なスペースの合計量 | バイト | |||
| disk.<file-system-name>.used_percentage | file-system-name | ファイルシステム上のすべてのファイルに現在割り当てられている利用可能なスペースの割合。 | パーセント | |||
| disk.<file-system-name>.itotal | file-system-name | ファイルシステム上の inode の合計数 | カウント | |||
| disk.<file-system-name>.iused | file-system-name | 使用されている inode の数。 | カウント | |||
| disk.<file-system-name>.iavail | file-system-name | 空き (未使用) inode の数。 | カウント | |||
| disk.<file-system-name>.iused_percentage | file-system-name | 使用済み inode の割合。 | パーセント | |||
| os.linux.metrics-system-disk-usage | disk_usage.<disk>.total | disk-name | このディスク上の利用可能なスペースの合計量 | バイト | ||
| disk_usage.<disk>.used | disk-name | このディスクで使用されているスペースの合計量 | バイト | |||
| disk_usage.<disk>.avail | disk-name | このディスク上の利用可能なスペースの合計量 | バイト | |||
| disk_usage.<disk>.used_percentage | disk-name | このディスクで使用されているスペースの割合 | パーセント | はい | はい | |
| os.linux.metrics-system-memoryos.linux.metrics-system-memory-percent | memory.total | 空 | 使用可能な RAM の合計 | KB | ||
| memory.free | 空 | 空き RAM の合計 | KB | |||
| memory.available | 空 | スワップなしで新しいアプリケーションを起動するために使用できる推定メモリ量。 | KB | |||
| memory.buffers | 空 | RAW ディスクブロックに使用される一時ストレージ | KB | |||
| memory.cached | 空 | ディスクから読み取られたファイルのメモリ内キャッシュ (ページキャッシュ)。mem_swapcached は含まれません。 | KB | |||
| memory.swapTotal | 空 | 利用可能なスワップスペースの合計量 | KB | はい | はい | |
| memory.swapFree | 空 | 現在使用されていないスワップスペースの量 | はい | はい | ||
| memory.dirty | 空 | ディスクへのライトバックを待機しているメモリ | KB | |||
| memory.swapUsed | 空 | 使用中のスワップスペースの量 | KB | はい | はい | |
| memory.used | 空 | 使用中の RAM 容量 | KB | |||
| memory.usedWOBuffersCaches | 空 | 使用中のメモリ量 | KB | |||
| memory.freeWOBuffersCaches | 空 | /proc/meminfo からの MemAvailable の値 (存在する場合)。存在しない場合は、空き + バッファー + キャッシュメモリにフォールバックします。 | KB | |||
| memory.swapUsedPercentage | 空 | 使用されたスワップスペースの割合 | パーセント | |||
| memory_percent.free | 空 | 空き RAM の割合 | パーセント | はい | はい | |
| memory_percent.available | 空 | 利用可能なメモリの割合 | パーセント | はい | はい | |
| memory_percent.buffers | 空 | RAW ディスクブロックに使用されるメモリの割合 | パーセント | はい | はい | |
| memory_percent.cached | 空 | ディスクから読み取られたファイルのメモリ内キャッシュで使用されるメモリの割合 | パーセント | はい | はい | |
| memory_percent.dirty | 空 | ディスクへのライトバックを待機しているメモリの割合 | パーセント | はい | はい | |
| memory_percent.swapUsed | 空 | 使用されたスワップスペースの割合 | パーセント | はい | はい | |
| memory_percent.usedWOBuffersCaches | 空 | 使用されているメモリの割合 | パーセント | はい | はい | |
| memory_percent.freeWOBuffersCaches | 空 | 利用可能なメモリの割合 | パーセント | はい | はい | |
| os.linux.metrics-system-uptime | system.uptime(sec) | 空 | システムが稼働中で利用可能な時間 | 秒 | ||
| os.linux.metrics-memory-vmstat | vmstat.nr_free_pages | 空 | システムで現在使用されていないページ | ページ | ||
| vmstat.nr_alloc_batch | 空 | 各 NUMA の各ドメインでメモリ不足が原因で他のドメインに割り当てられたページ | ページ | |||
| vmstat.nr_inactive_anon | 空 | 長期間アクセスされていない各 NUMA ノードの各ドメインのメモリページ | ページ | |||
| vmstat.nr_active_anon | 空 | 最近使用された匿名仮想メモリページ | KB | |||
| vmstat.nr_inactive_file | 空 | 各 NUMA の各ドメインで長期間アクセスされていないファイルに対応するメモリページ | KB | |||
| vmstat.nr_active_file | 空 | 最近アクセスしたファイルに対応するメモリページ | ページ | |||
| vmstat.nr_unevictable | 空 | 再利用不可能な (非) LRU リスト内のページ数 | カウント | |||
| vmstat.nr_mlock | 空 | 再利用不可能なページのクラスである VM_LOCKED VMA にマップされたページ | ページ | |||
| vmstat.nr_anon_pages | 空 | ファイルに含まれていないメモリマップ済みページ | ページ | |||
| vmstat.nr_mapped | 空 | メモリマップ済みページの数 | カウント | |||
| vmstat.nr_file_pages | 空 | |||||
| vmstat.nr_dirty | 空 | ディスクへの書き込みを待機しているページ | ページ | |||
| vmstat.nr_writeback | 空 | 現在ディスクに書き込中のページ | ページ | |||
| vmstat.nr_slab_reclaimable | 空 | 再利用可能なカーネル slab メモリのページの使用率 | ページ | |||
| vmstat.nr_slab_unreclaimable | 空 | 再利用できないカーネル slab メモリのページの使用率 | ページ | |||
| vmstat.nr_page_table_pages | 空 | ページテーブルに割り当てられたページ | ページ | |||
| vmstat.nr_kernel_stack | 空 | カーネルスタックに割り当てられたメモリ量 | KB | |||
| vmstat.nr_unstable | 空 | 各 NUMA ノードの各ドメイン内の不安定なページの数 | カウント | |||
| vmstat.nr_bounce | 空 | |||||
| vmstat.nr_vmscan_write | 空 | LRU のスキャン中にライトバックされたダーティページの数 | カウント | |||
| vmstat.nr_vmscan_immediate_reclaim | 空 | |||||
| vmstat.nr_writeback_temp | 空 | |||||
| vmstat.nr_isolated_anon | 空 | 各 NUMA ノードの各ドメインで隔離された匿名メモリページの数 | カウント | |||
| vmstat.nr_isolated_file | 空 | 各 NUMA ノードの各ドメインで隔離されたファイルストレージページのページ数 | カウント | |||
| vmstat.nr_shmem | 空 | 共有メモリページの数 | カウント | |||
| vmstat.nr_dirtied | 空 | 各 NUMA ノードの各ドメイン内のダーティページの数 | カウント | |||
| vmstat.nr_written | 空 | |||||
| vmstat.numa_hit | 空 | このノードに正常に割り当てられたページ数 | カウント | |||
| vmstat.numa_miss | 空 | 対象のノードのメモリ不足が原因でこのノードに割り当てられたページ数 | カウント | |||
| vmstat.numa_foreign | 空 | 最初にこのノードを対象としていたが、代わりに別のノードに割り当てられたページ数 | カウント | |||
| vmstat.numa_interleave | 空 | このノードに正常に割り当てられたインターリーブポリシーページの数 | カウント | |||
| vmstat.numa_local | 空 | このノードのプロセスによって、このノードに正常に割り当てられたページ数 | カウント | |||
| vmstat.numa_other | 空 | 別のノードのプロセスによって、このノードに割り当てられたページ数 | カウント | |||
| vmstat.workingset_refault | 空 | |||||
| vmstat.workingset_activate | 空 | |||||
| vmstat.workingset_nodereclaim | 空 | |||||
| vmstat.nr_anon_transparent_hugepages | 空 | |||||
| vmstat.nr_free_cma | 空 | 各 NUMA の各ドメイン内の連続した空メモリ割り当てページ | ||||
| vmstat.nr_dirty_threshold | 空 | |||||
| vmstat.nr_dirty_background_threshold | 空 | |||||
| vmstat.pgpgin | 空 | ディスクから取り込まれたページ数 | カウント | |||
| vmstat.pgpgout | 空 | ディスクに書き込まれたページ数 | カウント | |||
| vmstat.pswpin | 空 | スワップスペースから取り込まれたページ数 | カウント | |||
| vmstat.pswpout | 空 | スワップスペースにスワップアウトされたページ数 | カウント | |||
| vmstat.pgalloc_dma | 空 | |||||
| vmstat.pgalloc_dma32 | 空 | |||||
| vmstat.pgalloc_normal | 空 | |||||
| vmstat.pgalloc_movable | 空 | |||||
| vmstat.pgfree | 空 | 前回の起動以降の空きページ数 | カウント | |||
| vmstat.pgactivat | 空 | 前回の起動以降のページのアクティブ化の数 | カウント | |||
| vmstat.pgdeactivate | 空 | 前回の起動以降のページの非アクティブ化の数 | カウント | |||
| vmstat.pgfault | 空 | 前回の起動以降のマイナー障害の数 | ページ | |||
| vmstat.pgmajfault | 空 | 前回の起動以降のメジャー障害の数 | ページ | |||
| vmstat.pglazyfreed | 空 | |||||
| vmstat.pgrefill_dma | 空 | |||||
| vmstat.pgrefill_dma32 | 空 | |||||
| vmstat.pgrefill_normal | 空 | 前回の起動以降のページの再入力数 | カウント | |||
| vmstat.pgrefill_movable | 空 | |||||
| vmstat.pgsteal_kswapd_dma | 空 | |||||
| vmstat.pgsteal_kswapd_dma32 | 空 | |||||
| vmstat.pgsteal_kswapd_normal | 空 | |||||
| vmstat.pgsteal_kswapd_movable | 空 | |||||
| vmstat.pgsteal_direct_dma | 空 | |||||
| vmstat.pgsteal_direct_dma32 | 空 | |||||
| vmstat.pgsteal_direct_normal | 空 | |||||
| vmstat.pgsteal_direct_movable | 空 | |||||
| vmstat.pgscan_kswapd_dma | 空 | |||||
| vmstat.pgscan_kswapd_dma32 | 空 | |||||
| vmstat.pgscan_kswapd_normal | 空 | 起動以降に kswapd によってスキャンされたページ数 | カウント | |||
| vmstat.pgscan_kswapd_movable | 空 | |||||
| vmstat.pgscan_direct_dma | 空 | |||||
| vmstat.pgscan_direct_dma32 | 空 | |||||
| vmstat.pgscan_direct_normal | 空 | 起動以降に再利用されたページ数 | カウント | |||
| vmstat.pgscan_direct_movable | 空 | |||||
| vmstat.pgscan_direct_throttle | 空 | |||||
| vmstat.zone_reclaim_failed | 空 | |||||
| vmstat.pginodesteal | 空 | |||||
| vmstat.slabs_scanned | 空 | |||||
| vmstat.kswapd_inodesteal | 空 | |||||
| vmstat.kswapd_low_wmark_hit_quickly | 空 | |||||
| vmstat.kswapd_high_wmark_hit_quickly | 空 | |||||
| vmstat.pageoutrun | 空 | kswapd がページ再利用を呼び出した回数 | カウント | |||
| vmstat.allocstall | 空 | ページ再利用が直接呼び出された回数 (メモリ不足) | カウント | |||
| vmstat.pgrotated | 空 | |||||
| vmstat.drop_pagecache | 空 | |||||
| vmstat.drop_slab | 空 | |||||
| vmstat.numa_pte_updates | 空 | |||||
| vmstat.numa_huge_pte_updates | 空 | |||||
| vmstat.numa_hint_faults | 空 | |||||
| vmstat.numa_hint_faults_local | 空 | |||||
| vmstat.numa_pages_migrated | 空 | |||||
| vmstat.pgmigrate_success | 空 | |||||
| vmstat.pgmigrate_fail | 空 | |||||
| vmstat.compact_migrate_scanned | 空 | |||||
| vmstat.compact_free_scanned | 空 | |||||
| vmstat.compact_isolated | 空 | |||||
| vmstat.compact_stall | 空 | 大容量ページを解放して使用できるようにメモリ圧縮を実行するために、プロセスが停止する回数 | カウント | |||
| vmstat.compact_fail | 空 | システムがメモリの圧縮を試みたが失敗した回数 | カウント | |||
| vmstat.compact_success | 空 | システムがメモリを圧縮して大容量ページを解放した回数 | カウント | |||
| vmstat.htlb_buddy_alloc_success | 空 | |||||
| vmstat.htlb_buddy_alloc_fail | 空 | |||||
| vmstat.unevictable_pgs_culled | 空 | |||||
| vmstat.unevictable_pgs_scanned | 空 | |||||
| vmstat.unevictable_pgs_rescued | 空 | |||||
| vmstat.unevictable_pgs_mlocked | 空 | |||||
| vmstat.unevictable_pgs_munlocked | 空 | |||||
| vmstat.unevictable_pgs_cleared | 空 | |||||
| vmstat.unevictable_pgs_stranded | 空 | |||||
| vmstat.thp_fault_alloc | 空 | ページフォールトを処理するために正常に割り当てられた大容量ページの数 | カウント | |||
| vmstat.thp_fault_fallback | 空 | 大容量ページの割り当てに失敗して、代わりに小容量ページの使用にフォールバックしたページフォールトの数 | カウント | |||
| vmstat.thp_collapse_alloc | 空 | データを格納するために、折りたたまれて 1 つの大容量ページに正常に割り当てられたページ範囲の数 | カウント | |||
| vmstat.thp_collapse_alloc_failed | 空 | 折りたたまれて 1 つの大容量ページに割り当てようとして失敗したページ範囲の数 | カウント | |||
| vmstat.thp_split | 空 | 大容量ページからベースページに分割する数 | カウント | |||
| vmstat.thp_zero_page_alloc | 空 | 大容量ゼロページの割り当てに成功した数 | カウント | |||
| vmstat.thp_zero_page_alloc_failed | 空 | カーネルが大容量ゼロページの割り当てに失敗し、小容量ページの使用にフォールバックする回数 | カウント | |||
| vmstat.balloon_inflate | 空 | |||||
| vmstat.balloon_deflate | 空 | |||||
| vmstat.balloon_migrate | 空 | |||||
| os.linux.metrics-process-status | proc.<process>.VmSize | process-name | プロセスによって使用される仮想メモリの合計量 | KB | ||
| proc.<process>.VmRSS | process-name | プロセスによって使用されるスワップされていない物理メモリ | KB | |||
| proc.<process>.VmSwap | process-name | 使用されているスワップスペースの合計量 | KB |
Linux ネットワーク監視チェック
注:
以前のバージョンからアップグレードする場合は、このテーブルのチェックを Linux メトリクスポリシーに手動で追加します。
| タイプ | チェック | 説明 | 使用方法と使用例 | 収集されるメトリクス | 主なメトリクス |
|---|---|---|---|---|---|
| メトリクス | os.linux.metrics-network-interface | Linux サーバーのすべてのネットワークインターフェイス関連のメトリクスを取得します。 | 使用法:
使用例: |
|
はい |
| メトリクス | os.linux.metrics-netstat-tcp | netstat から TCP ソケット状況のメトリクスを取得します。短時間の TCP 接続が多数発生する、トラフィックの多い Web サーバーまたはプロキシサーバーで役立ちます。 | 使用法:
使用例: |
|
いいえ |