Linux verificações e políticas padrão
Agent Client Collector fornece as seguintes verificações e políticas padrão para Linux monitoramento de métricas.
Verificações de métricas de monitoramento do Linux
| Verificação | Nome de métrica | Recurso | Descrição | Unidades | Métrica em destaque | Detecção de Anomalia |
|---|---|---|---|---|---|---|
| os.linux.metrics-process-usage | proc.acc.em execução | process-name | Número de processos em execução com este nome (acc) | contagem | ||
| proc.acc.cpuPercent | process-name | Percentual de cpu usado pelo processo. | porcentagem | |||
proc.acc.memPercent |
process-name | Porcentagem de memória usada pelo processo. | porcentagem | |||
| os.linux.metrics-reboot-count-today | reboot.count.today | vazio | Número de reinicializações concluídas hoje | contagem | ||
| os.linux.metrics-system-cpu | cpu.total.usuário | total | Processos normais em execução no modo de usuário; cpu.total.user é o total das métricas cpuN.user. | contagem | ||
| cpu.total.nice | total | Processos do NICE em execução no modo de usuário; cpu.total.nice é o total das métricas cpuN.nice. | contagem | |||
| cpu.total.sistema | total | Tempo gasto pela CPU na execução do kernel; cpu.total.system é o total das métricas cpuN.system. | s | |||
| cpu.total.idle | total | Tempo total que a CPU gastou em um estado ocioso.; cpu.total.idle é o total de métricas cpuN.idle. | s | |||
| cpu.total.iowait | total | Tempo total que a CPU gastou aguardando a conclusão das operações de E/S. cpu.total.iowait é o total das métricas cpuN.iowait. | s | |||
| cpu.total.irq | total | Total de tempo que o processador está gastando para lidar com Interrupções.; cpu.total.irq é o total das métricas cpuN.irq. | s | |||
| cpu.total.softirq | total | Tempo gasto no atendimento de solicitações de interrupção flexível; cpu.total.softirq é o total das métricas cpuN.softirq. | s | |||
| cpu.total.roubo | total | Tempo total que a CPU virtual gastou aguardando o hipervisor atender a outra CPU virtual. Aplica-se somente a máquinas virtuais. | s | |||
| cpu.total.convidado | total | Tempo total que a CPU gastou executando o processador virtual. Aplica-se somente a hipervisores. | s | |||
| cpu.total.convidado_nice | total | Tempo total que a CPU gastou executando como SO convidado. cpu.total.guset_nice é o total das métricas cpuN.guest_nice | s | |||
| cpu.<cpu-core> .usuário | cpu-core | Tempo gasto com processamento normal no modo de usuário. | s | |||
| cpu.<cpu-core> .agradável | cpu-core | Tempo gasto com processos de limpeza no modo de usuário. | s | |||
| cpu.<cpu-core> .sistema | cpu-core | Tempo gasto na execução no modo kernel. | s | |||
| cpu.<cpu-core> .ocioso | cpu-core | Tempo gasto em férias girando os polegares. | s | |||
| cpu.<cpu-core> .iowait | cpu-core | Tempo gasto aguardando a conclusão de E/S. Isso também é considerado tempo ocioso. | s | |||
| cpu.<cpu-core> .irq | cpu-core | Tempo gasto no atendimento a interrupções de hardware. | s | |||
| cpu.<cpu-core> .softirq | cpu-core | Tempo gasto no atendimento a interrupções de software. | s | |||
| cpu.<cpu-core> .roubo | cpu-core | Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual. | s | |||
| cpu.<cpu-core> .convidado | cpu-core | Tempo gasto na execução de uma CPU virtual ou SO convidado sob o controle do kernel. | s | |||
| cpu.<cpu-core> .convidado_nice | cpu-core | Tempo total que a CPU gastou executando como SO convidado. | s | |||
| cpu.intr | vazio | Interrupções atendidas desde o momento da inicialização. | s | |||
| cpu.ctxt | vazio | Número total de comutadores de contexto em todas as CPUs. | contagem | |||
| cpu.btime | vazio | A hora em que o sistema foi inicializado | s | |||
| cpu.processos | vazio | O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas de sistema fork() e clone(). | contagem | |||
| cpu.procs_running | vazio | O número total de processos em execução em todas as CPUs. | contagem | |||
| cpu.procs_blocked | vazio | O número de processos bloqueados no momento, aguardando a conclusão da E/S. | contagem | |||
| cpu.cpu_count | vazio | Número de cpu no sistema | contagem | |||
| cpu.<cpu-core> .cores | cpu-core | O número de núcleos de CPU | contagem de núcleos | |||
| os.linux.metrics-system-cpu-load | load_avg.one | vazio | A carga média do sistema em um minuto. | contagem de threads | sim | sim |
| carga_média.cinco | vazio | A carga média do sistema em cinco minutos. | contagem de threads | sim | sim | |
| carga_média.quinze | vazio | A carga média do sistema em quinze minutos. | contagem de threads | sim | sim | |
| load_avg.norm.one | vazio | A carga média do sistema em um minuto normalizada pelo número de CPUs. | contagem de threads | |||
| load_avg.norm.cinco | vazio | A carga média do sistema ao longo de cinco minutos normalizada pelo número de CPUs. | contagem de threads | |||
| load_avg.norm.quinze | vazio | A carga média do sistema ao longo de quinze minutos normalizada pelo número de CPUs. | contagem de threads | |||
| os.linux.metrics-system-cpu-percentage | cpu.avgutilization_porcentagem | vazio | Percentual de cpu foi usado em média | porcentagem | ||
| cpu.user_porcentagem | vazio | Porcentagem de tempo total de cpu usada por processos normais no modo de usuário | porcentagem | sim | sim | |
| cpu.nice_porcentagem | vazio | Percentual de tempo em que todas as CPUs são usadas por processos limpos no modo de usuário | porcentagem | sim | sim | |
cpu.system_porcentagem |
vazio | A porcentagem de tempo que a CPU gastou na execução do kernel. | porcentagem | sim | sim | |
| cpu.idle_percentage | vazio | Percentual de tempo em que todas as CPUs ficaram ociosas | porcentagem | sim | sim | |
cpu.iowait_porcentagem |
vazio | Percentual de tempo em que todas as CPUs aguardam a conclusão de E/S | porcentagem | sim | sim | |
| cpu.irq_porcentagem | vazio | Percentual de tempo de interrupções de serviço de cpus | porcentagem | sim | sim | |
cpu.softirq_porcentagem |
vazio | Percentual de tempo de interrupções de software de serviço de cpus | porcentagem | sim | sim | |
| cpu.steal_percentage | vazio | Percentual de tempo em que todos os sistemas operacionais de hosts virtuais atendidos por cpus | porcentagem | sim | sim | |
| cpu.convidado_porcentagem | vazio | Percentual de tempo em que todas as CPUs do sistema operacional convidado foram atendidas | porcentagem | sim | sim | |
| os.linux.metrics-system-disk | disco.<disk-name> .leituras | nome-disco | Número total de leituras concluídas com sucesso. | contagem | sim | sim |
| disco.<disk-name> .readsMerged | nome-disco | Número total de leituras mescladas | contagem | |||
| disco.<disk-name> .sectorsLeitura | nome-disco | Número total de setores lidos com sucesso. | contagem | |||
| disco.<disk-name> .readTime | nome-disco | Número total de milissegundos gastos por todas as leituras. | milissegundos | |||
| disco.<disk-name> .gravações | nome-disco | Número total de gravações concluídas com sucesso. | contagem | sim | sim | |
| disco.<disk-name> .writesMerged | nome-disco | Número total de gravações mescladas | contagem | |||
| disco.<disk-name> .setoresGravados | nome-disco | Número total de setores gravados com sucesso. | contagem | |||
| disco.<disk-name> .writeTime | nome-disco | Número total de milissegundos gastos por todas as gravações. | erro de segundo | |||
| disco.<disk-name> .ioInProgress | nome-disco | Número total de E/Ss em andamento no momento | contagem | |||
| disco.<disk-name> .ioTime | Total de tempo gasto fazendo E/Ss | milissegundos | sim | sim | ||
| disco.<disk-name> .ioTimeWeighted | nome-disco | Tempo total gasto em E/Ss. Isso pode fornecer uma medida fácil do tempo de conclusão de E/S e do backlog que pode estar se acumulando. | milissegundos | |||
| os.linux.metrics-system-disk-capacity | disco.<file-system-name> .total | file-system-name | O tamanho total do sistema de arquivos. | byte | ||
| disco.<file-system-name> .usado | file-system-name | A quantidade total de espaço alocado para arquivos existentes no sistema de arquivos. | byte | |||
| disco.<file-system-name> .disponível | file-system-name | A quantidade total de espaço disponível no sistema de arquivos. | byte | |||
| disco.<file-system-name> .used_percentage | file-system-name | A porcentagem do espaço disponível atualmente alocado para todos os arquivos no sistema de arquivos. | porcentagem | |||
| disco.<file-system-name> .itotal | file-system-name | O número total de nós no sistema de arquivos. | contagem | |||
| disco.<file-system-name> .usado | file-system-name | O número de nós usados. | contagem | |||
| disco.<file-system-name> .ivail | file-system-name | O número de nós livres (não utilizados). | contagem | |||
| disco.<file-system-name> .used_percentage | file-system-name | A porcentagem de nós usados. | porcentagem | |||
| os.linux.metrics-system-disk-usage | disk_usage.<disk> .total | nome-disco | Quantidade total de espaço disponível neste disco | bytes | ||
| disk_usage.<disk> .usado | nome-disco | Quantidade total de espaço usado neste disco | bytes | |||
| disk_usage.<disk> .disponível | nome-disco | Quantidade total de espaço disponível neste disco | bytes | |||
| disk_usage.<disk> .used_porcentagem | nome-disco | A porcentagem de espaço usada neste disco | porcentagem | sim | sim | |
| os.linux.metrics-system-memoryos.linux.metrics-system-memory-percent | memória.total | vazio | Total de RAM utilizável. | Base de conhecimento | ||
| memória.livre | vazio | Total de RAM livre. | Base de conhecimento | |||
| memória.disponível | vazio | Uma estimativa da quantidade de memória disponível para iniciar novas aplicações, sem troca. | Base de conhecimento | |||
| memória. buffers | vazio | Armazenamento temporário usado para blocos de disco bruto. | Base de conhecimento | |||
| memória.cache | vazio | Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached. | Base de conhecimento | |||
| memory.swapTotal | vazio | Quantidade total de espaço de troca disponível. | Base de conhecimento | sim | sim | |
| memória.swapLivre | vazio | Quantidade de espaço de troca que não está sendo usada no momento. | sim | sim | ||
| memória.suja | vazio | Memória que está aguardando para ser gravada de volta no disco. | Base de conhecimento | |||
| memória.swapUsado | vazio | A quantidade de espaço de troca em uso. | Base de conhecimento | sim | sim | |
| memória.usada | vazio | A quantidade de RAM em uso. | Base de conhecimento | |||
| memory.usedWOBuffersCaches | vazio | A quantidade de memória em uso. | Base de conhecimento | |||
| memory.freeWOBuffersCaches | vazio | Valor de MemAvailable de /proc/meminfo se presente, mas retorna para adicionar memória livre + em buffer + em cache se não estiver. | Base de conhecimento | |||
| memory.swapUsedPercentage | vazio | Percentual de espaço de troca usado. | porcentagem | |||
| memory_percent.livre | vazio | Percentual de RAM livre | porcentagem | sim | sim | |
| memory_percent.disponível | vazio | Percentual de memória disponível | porcentagem | sim | sim | |
| memory_percent. buffers | vazio | Percentual de memória usado para blocos de disco bruto | porcentagem | sim | sim | |
| memory_percent.em cache | vazio | Percentual de memória usada para cache na memória para arquivos lidos do disco | porcentagem | sim | sim | |
| memory_percent.sujo | vazio | Percentual de memória aguardando para ser gravado de volta no disco. | porcentagem | sim | sim | |
| memory_percent.swapUsed | vazio | Percentual de espaço de troca usado. | porcentagem | sim | sim | |
| memory_percent.usedWOBuffersCaches | vazio | A porcentagem de memória está sendo usada | porcentagem | sim | sim | |
| memory_percent.freeWOBuffersCaches | vazio | Percentual de memória disponível | porcentagem | sim | sim | |
| os.linux.metrics-system-uptime | system.uptime(s) | vazio | A quantidade de tempo em que o sistema está funcionando e disponível. | s | ||
| os.linux.metrics-memory-vmstat | vmstat.nr_free_pages | vazio | Páginas que não estão sendo usadas pelo sistema no momento. | páginas | ||
| vmstat.nr_alloc_batch | vazio | páginas alocadas a outros domínios devido à memória insuficiente em cada domínio de cada NUMA | páginas | |||
| vmstat.nr_inactive_anon | vazio | páginas de memória em cada domínio de cada nó NUMA que não são acessadas há muito tempo | páginas | |||
| vmstat.nr_active_anon | vazio | Páginas de memória virtual anônima que foram usadas recentemente | Base de conhecimento | |||
| vmstat.nr_inactive_arquivo | vazio | A página de memória correspondente ao arquivo que não é acessado há muito tempo em cada domínio de cada NUMA. | Base de conhecimento | |||
| vmstat.nr_ativo_arquivo | vazio | A página de memória correspondente ao arquivo que foi acessado recentemente. | páginas | |||
| vmstat.nr_unvictable | vazio | O número de páginas está na lista LRU (sem) indesejável | contagem | |||
| vmstat.nr_mlock | vazio | Páginas mapeadas em um VMA VM_LOCKED - são uma classe de páginas que não podem ser removidas. | páginas | |||
| vmstat.nr_anon_pages | vazio | Páginas mapeadas na memória que não fazem parte de um arquivo. | páginas | |||
| vmstat.nr_mapped | vazio | O número de páginas mapeadas de memória. | contagem | |||
| vmstat.nr_file_pages | vazio | |||||
| vmstat.nr_dirty | vazio | Páginas aguardando gravação no disco | páginas | |||
| vmstat.nr_writeback | vazio | Páginas sendo gravadas no momento no disco | páginas | |||
| vmstat.nr_slab_recuperável | vazio | Páginas do uso de memória de slab do kernel que podem ser recuperadas | páginas | |||
| vmstat.nr_slab_irrecuperável | vazio | Páginas do uso de memória de slab do kernel que não podem ser recuperadas | páginas | |||
| vmstat.nr_page_table_pages | vazio | Páginas alocadas para tabelas de páginas | páginas | |||
| vmstat.nr_kernel_stack | vazio | Quantidade de memória alocada para pilhas de kernel. | Base de conhecimento | |||
| vmstat.nr_unstable | vazio | O número de páginas instáveis em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_bounce | vazio | |||||
| vmstat.nr_vmscan_write | vazio | O número de páginas sujas gravadas durante uma verificação de LRU(s) | contagem | |||
| vmstat.nr_vmscan_immediate_reclaim | vazio | |||||
| vmstat.nr_writeback_temp | vazio | |||||
| vmstat.nr_isolated_anon | vazio | O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_isolated_file | vazio | O número de páginas de armazenamento de arquivos isoladas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_shmem | vazio | O número de páginas de memória compartilhada | contagem | |||
| vmstat.nr_dirtied | vazio | O número de páginas sujas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_escrito | vazio | |||||
| vmstat.numa_hit | vazio | O número de páginas que foram alocadas com sucesso para este nó. | contagem | |||
| vmstat.numa_miss | vazio | O número de páginas que foram alocadas neste nó devido à pouca memória no nó pretendido. | contagem | |||
| vmstat.numa_estrangeiro | vazio | O número de páginas inicialmente destinadas a este nó que foram alocadas para outro nó. | contagem | |||
| vmstat.numa_intercalado | vazio | O número de páginas de política intercaladas alocadas com sucesso para este nó. | contagem | |||
| vmstat.numa_local | vazio | O número de páginas alocadas com sucesso neste nó, por um processo neste nó | contagem | |||
| vmstat.numa_outros | vazio | O número de páginas alocadas neste nó por um processo em outro nó. | contagem | |||
| vmstat.workset_refault | vazio | |||||
| vmstat.workset_ativar | vazio | |||||
| vmstat.workset_nodereclaim | vazio | |||||
| vmstat.nr_anon_transparent_hugepages | vazio | |||||
| vmstat.nr_free_cma | vazio | Páginas do alocador de memória contínua livre em cada domínio de cada NUMA | ||||
| vmstat.nr_dirty_threshold | vazio | |||||
| vmstat.nr_dirty_background_threshold | vazio | |||||
| vmstat.pgpgin | vazio | O número de páginas trazidas do disco | contagem | |||
| vmstat.pgpgout | vazio | O número de páginas gravadas no disco | contagem | |||
| vmstat.pswpin | vazio | O número de páginas trazidas do espaço de troca | contagem | |||
| vmstat.pswpout | vazio | O número de páginas trocadas no espaço de troca | contagem | |||
| vmstat.pgalloc_dma | vazio | |||||
| vmstat.pgalloc_dma32 | vazio | |||||
| vmstat.pgalloc_normal | vazio | |||||
| vmstat.pgalloc_movable | vazio | |||||
| vmstat.pglivre | vazio | O número de páginas livres desde a última inicialização | contagem | |||
| vmstat.pgactivat | vazio | Número de ativações de página desde a última inicialização | contagem | |||
| vmstat.pgdesativar | vazio | Número de desativações de página desde a última inicialização | contagem | |||
| vmstat.pgfault | vazio | Falhas secundárias desde a última inicialização | páginas | |||
| vmstat.pgmajfault | vazio | Falhas graves desde a última inicialização | páginas | |||
| vmstat.pglazyfreed | vazio | |||||
| vmstat.pgrefill_dma | vazio | |||||
| vmstat.pgrefill_dma32 | vazio | |||||
| vmstat.pgrefill_normal | vazio | Número de reabastecimentos de página desde a última inicialização | contagem | |||
| vmstat.pgrefill_movable | vazio | |||||
| vmstat.pgsteal_kswapd_dma | vazio | |||||
| vmstat.pgsteal_kswapd_dma32 | vazio | |||||
| vmstat.pgsteal_kswapd_normal | vazio | |||||
| vmstat.pgsteal_kswapd_movable | vazio | |||||
| vmstat.pgsteal_direct_dma | vazio | |||||
| vmstat.pgsteal_direct_dma32 | vazio | |||||
| vmstat.pgsteal_direct_normal | vazio | |||||
| vmstat.pgsteal_direct_movable | vazio | |||||
| vmstat.pgscan_kswapd_dma | vazio | |||||
| vmstat.pgscan_kswapd_dma32 | vazio | |||||
| vmstat.pgscan_kswapd_normal | vazio | Número de páginas verificadas pelo kswapd desde a inicialização | contagem | |||
| vmstat.pgscan_kswapd_movable | vazio | |||||
| vmstat.pgscan_direct_dma | vazio | |||||
| vmstat.pgscan_direct_dma32 | vazio | |||||
| vmstat.pgscan_direct_normal | vazio | Número de páginas recuperadas desde a inicialização | contagem | |||
| vmstat.pgscan_direct_movable | vazio | |||||
| vmstat.pgscan_direct_throttle | vazio | |||||
| vmstat.zone_reclaim_failed | vazio | |||||
| vmstat.pginodesteal | vazio | |||||
| vmstat.slabs_scanned | vazio | |||||
| vmstat.kswapd_inodesteal | vazio | |||||
| vmstat.kswapd_low_wmark_hit_quickly | vazio | |||||
| vmstat.kswapd_high_wmark_hit_quickly | vazio | |||||
| vmstat.pageoutrun | vazio | Número de vezes que o kswapd acionou a recuperação de página | contagem | |||
| vmstat.allocstall | vazio | Número de vezes que a recuperação de página foi chamada diretamente (memória baixa) | contagem | |||
| vmstat.pgrotated | vazio | |||||
| vmstat.drop_pagecache | vazio | |||||
| vmstat.drop_slab | vazio | |||||
| vmstat.numa_pte_updates | vazio | |||||
| vmstat.numa_huge_pte_updates | vazio | |||||
| vmstat.numa_hint_falhas | vazio | |||||
| vmstat.numa_hint_faults_local | vazio | |||||
| vmstat.numa_pages_migred | vazio | |||||
| vmstat.pgmigrate_sucesso | vazio | |||||
| vmstat.pgmigrate_fail | vazio | |||||
| vmstat.compact_migrate_scanned | vazio | |||||
| vmstat.compact_free_scanned | vazio | |||||
| vmstat.compact_isolado | vazio | |||||
| vmstat.compact_stall | vazio | O número de vezes que um processo é interrompido para executar a compactação de memória para que uma página enorme esteja livre para uso. | contagem | |||
| vmstat.compact_fail | vazio | O número de vezes que o sistema tentou compactar a memória, mas falhou. | contagem | |||
| vmstat.compact_sucesso | vazio | O número de vezes que o sistema compactou a memória e liberou uma página enorme para uso. | contagem | |||
| vmstat.htlb_buddy_alloc_success | vazio | |||||
| vmstat.htlb_buddy_alloc_fail | vazio | |||||
| vmstat.unevictable_pgs_culled | vazio | |||||
| vmstat.unevictable_pgs_scanned | vazio | |||||
| vmstat.unevictable_pgs_rescued | vazio | |||||
| vmstat.unevictable_pgs_mlocked | vazio | |||||
| vmstat.unevictable_pgs_munlocked | vazio | |||||
| vmstat.unevictable_pgs_cleared | vazio | |||||
| vmstat.unevictable_pgs_stranded | vazio | |||||
| vmstat.thp_fault_alloc | vazio | O número de páginas enormes foi alocado com sucesso para lidar com uma falha de página. | contagem | |||
| vmstat.thp_fault_Fallback | vazio | O número de falhas de página falha ao alocar uma página enorme e, em vez disso, volta a usar páginas pequenas. | contagem | |||
| vmstat.thp_collapse_alloc | vazio | O número de recolhimentos de um intervalo de páginas em uma página enorme e, em seguida, a alocação bem-sucedida de uma nova página enorme para armazenar os dados. | contagem | |||
| vmstat.thp_collapse_alloc_failed | vazio | O número de recolhimentos de um intervalo de páginas em uma página enorme, mas com falha na alocação. | contagem | |||
| vmstat.thp_split | vazio | O número de divisões de uma página enorme em páginas de base | contagem | |||
| vmstat.thp_zero_page_alloc | vazio | O número de alocações bem-sucedidas de páginas zero enormes | contagem | |||
| vmstat.thp_zero_page_alloc_failed | vazio | O número de vezes em que o kernel falhou ao alocar uma página zero enorme e voltou a usar páginas pequenas. | contagem | |||
| vmstat.Balloon_inflate | vazio | |||||
| vmstat.balão_deflate | vazio | |||||
| vmstat.balão_migrate | vazio | |||||
| os.linux.metrics-process-status | proc.<process> .VmSize | process-name | A quantidade total de memória virtual usada pelo processo | Base de conhecimento | ||
| proc.<process> .VmRSS | process-name | A memória física não trocada que um processo usou | Base de conhecimento | |||
| proc.<process> .VmSwap | process-name | A quantidade total de espaço de troca usado. | Base de conhecimento |
Verificações de monitoramento de rede do Linux
Nota:
Ao atualizar de uma versão anterior, adicione manualmente as verificações nesta tabela à política de métricas do Linux.
| Tipo | Verificação | Descrição | Uso e exemplo de uso | Métricas coletadas | Métrica em destaque |
|---|---|---|---|---|---|
| Métrica | os.linux.metrics-network-interface | Recupera todas as métricas relacionadas à interface de rede para servidores Linux. | Uso:
Exemplo de uso: |
|
sim |
| Métrica | os.linux.metrics-netstat-tcp | Recupera métricas nos estados do soquete TCP do netstat. Útil em servidores proxy ou da Web de alto tráfego com um grande número de conexões TCP de curta duração entrando e saindo. | Uso:
Exemplo de uso: |
|
não |