Linux verificações e políticas padrão
Agent Client Collector fornece as seguintes verificações e políticas padrão para Linux monitoramento de métricas.
Verificações de métricas de monitoramento do Linux
| Verificação | Nome de métrica | Recurso | Descrição | Unidades | Métrica em destaque | Detecção de Anomalia |
|---|---|---|---|---|---|---|
| os.linux.metrics-process-usage | proc.acc.em execução | nome-do-processo | Número de processos em execução com este nome (acc) | contagem | ||
| proc.acc.cpuPercent | nome-do-processo | Porcentagem de CPU usada pelo processo. | percentual | |||
proc.acc.memPercentual |
nome-do-processo | Porcentagem de memória usada pelo processo. | percentual | |||
| os.linux.metrics-reboot-count-today | reiniciar.contagem.hoje | vazio | Número de reinicializações concluídas hoje | contagem | ||
| os.linux.metrics-system-cpu | cpu.total.usuário | total | Processos normais em execução no modo de usuário; cpu.total.user é o total das métricas cpuN.user. | contagem | ||
| cpu.total.nice | total | Processos do ANS em execução no modo de usuário; cpu.total.nice é o total das métricas cpuN.nice. | contagem | |||
| cpu.total.sistema | total | Tempo gasto pela CPU na execução do kernel; cpu.total.system é o total de métricas cpuN.system. | s | |||
| cpu.total.idle | total | Total de tempo que a CPU gastou em um estado ocioso.; cpu.total.idle é o total de métricas cpuN.idle. | s | |||
| cpu.total.iowait | total | Tempo total que a CPU gastou aguardando a conclusão das operações de E/S. cpu.total.iowait é o total das métricas cpuN.iowait. | s | |||
| cpu.total.irq | total | Total de tempo que o processador está gastando no processamento de interrupções. cpu.total.irq é o total das métricas cpuN.irq. | s | |||
| cpu.total.softirq | total | Tempo gasto no atendimento a solicitações de interrupção de software; cpu.total.softirq é o total das métricas cpuN.softirq. | s | |||
| CPU.total.roubo | total | Tempo total que a CPU virtual gastou aguardando o hipervisor fazer a manutenção de outra CPU virtual. Aplica-se somente a máquinas virtuais. | s | |||
| cpu.total.convidado | total | Tempo total que a CPU gastou na execução do processador virtual. Aplica-se somente a hipervisores. | s | |||
| cpu.total.guest_nice | total | Tempo total que a CPU gastou na execução como um sistema operacional convidado. cpu.total.guset_nice si o total das métricas cpuN.guest_nice | s | |||
| CPU.<cpu-core> .usuário | cpu-core | Tempo gasto com processamento normal no modo de usuário. | s | |||
| CPU.<cpu-core> .nice | cpu-core | Tempo gasto com processos bem-sucedidos no modo de usuário. | s | |||
| CPU.<cpu-core> .sistema | cpu-core | Tempo gasto na execução no modo kernel. | s | |||
| CPU.<cpu-core> .idle | cpu-core | Tempo gasto em férias girando os polegares. | s | |||
| CPU.<cpu-core> .iowait | cpu-core | Tempo gasto aguardando a conclusão da E/S. Isso também é considerado tempo ocioso. | s | |||
| CPU.<cpu-core> .irq | cpu-core | Tempo gasto no atendimento a interrupções de hardware. | s | |||
| CPU.<cpu-core> .softirq | cpu-core | Tempo gasto no atendimento a interrupções de software. | s | |||
| CPU.<cpu-core> .roubo | cpu-core | Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual. | s | |||
| CPU.<cpu-core> .convidado | cpu-core | Tempo gasto na execução de uma CPU virtual ou SO convidado sob o controle do kernel. | s | |||
| CPU.<cpu-core> .guest_nice | cpu-core | Tempo total que a CPU gastou na execução como um sistema operacional convidado. | s | |||
| cpu.intr | vazio | Interrupções atendidas desde a inicialização. | s | |||
| cpu.ctxt | vazio | Número total de comutadores de contexto em todas as CPUs. | contagem | |||
| cpu.btime | vazio | A hora em que o sistema foi inicializado | s | |||
| cpu.processos | vazio | O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas do sistema fork() e clone(). | contagem | |||
| cpu.procs_running | vazio | O número total de processos em execução em todas as CPUs. | contagem | |||
| cpu.procs_blocked | vazio | O número de processos atualmente bloqueados, aguardando a conclusão da E/S. | contagem | |||
| cpu.cpu_count | vazio | Número de CPUs no sistema | contagem | |||
| CPU.<cpu-core> .núcleos | cpu-core | O número de núcleos de CPU | contagem de núcleos | |||
| os.linux.metrics-system-cpu-load | load_avg.um | vazio | A carga média do sistema em um minuto. | contagem de threads | sim | sim |
| carga_média.cinco | vazio | A carga média do sistema ao longo de cinco minutos. | contagem de threads | sim | sim | |
| méd_carga.quinze | vazio | A carga média do sistema ao longo de quinze minutos. | contagem de threads | sim | sim | |
| load_avg.norm.one | vazio | A carga média do sistema em um minuto normalizada pelo número de CPUs. | contagem de threads | |||
| méd_carga.norm.cinco | vazio | A carga média do sistema ao longo de cinco minutos normalizada pelo número de CPUs. | contagem de threads | |||
| méd_carga.norm.quinze | vazio | A carga média do sistema ao longo de quinze minutos normalizada pelo número de CPUs. | contagem de threads | |||
| os.linux.metrics-system-cpu-percentage | cpu.avgutilization_percentage | vazio | Percentual da CPU usada em média | percentual | ||
| cpu.user_percentual | vazio | Percentual de tempo total de CPU usado por processos normais no modo de usuário | percentual | sim | sim | |
| cpu.nice_percentual | vazio | Porcentagem de tempo de todas as cpus usadas por processos com atenção no modo de usuário | percentual | sim | sim | |
cpu.system_percentual |
vazio | O percentual de tempo gasto pela CPU na execução do kernel. | percentual | sim | sim | |
| cpu.idle_percentage | vazio | Percentual de tempo em que todas as CPUs ficaram ociosas | percentual | sim | sim | |
cpu.iowait_percentual |
vazio | Percentual de tempo em que todas as CPUs aguardam a conclusão de E/S | percentual | sim | sim | |
| cpu.irq_percentage | vazio | Percentual de tempo em que todas as interrupções de serviço da cpus | percentual | sim | sim | |
cpu.softirq_percentual |
vazio | Percentual de tempo em que todas as interrupções de software de manutenção de cpus | percentual | sim | sim | |
| CPU.roubo_percentual | vazio | Percentual de tempo em todos os sistemas operacionais de hosts virtuais atendidos pela cpus | percentual | sim | sim | |
| cpu.guest_percentual | vazio | Porcentagem de tempo de todos os sistemas operacionais convidados atendidos pela cpus | percentual | sim | sim | |
| os.linux.metrics-system-disk | disco.<disk-name> .leituras | nome do disco | Número total de leituras concluídas com sucesso. | contagem | sim | sim |
| disco.<disk-name> .readsMesclado | nome do disco | Número total de leituras mescladas | contagem | |||
| disco.<disk-name> .sectorsRead | nome do disco | Número total de setores lidos com sucesso. | contagem | |||
| disco.<disk-name> .readTime | nome do disco | Número total de milissegundos gastos em todas as leituras. | milissegundos | |||
| disco.<disk-name> .gravações | nome do disco | Número total de gravações concluídas com sucesso. | contagem | sim | sim | |
| disco.<disk-name> .writesMesclado | nome do disco | Número total de gravações mescladas | contagem | |||
| disco.<disk-name> .sectorsWritten | nome do disco | Número total de setores gravados com sucesso. | contagem | |||
| disco.<disk-name> .writeTime | nome do disco | Número total de milissegundos gastos em todas as gravações. | erronecessário | |||
| disco.<disk-name> .ioInProgress | nome do disco | Número total de E/Ss em andamento no momento | contagem | |||
| disco.<disk-name> .ioTime | Tempo total gasto em E/Ss | milissegundos | sim | sim | ||
| disco.<disk-name> .ioTimeWeighted | nome do disco | Total de tempo gasto em E/Ss. Isso pode fornecer uma medida fácil do tempo de conclusão de E/S e do backlog que pode estar se acumulando. | milissegundos | |||
| os.linux.metrics-system-disk-capacity | disco.<file-system-name> .total | file-system-name | O tamanho total do sistema de arquivos. | byte | ||
| disco.<file-system-name> .usado | file-system-name | A quantidade total de espaço alocada para arquivos existentes no sistema de arquivos. | byte | |||
| disco.<file-system-name> .avail | file-system-name | A quantidade total de espaço disponível no sistema de arquivos. | byte | |||
| disco.<file-system-name> .used_percentage | file-system-name | A porcentagem do espaço disponível atualmente alocado para todos os arquivos no sistema de arquivos. | percentual | |||
| disco.<file-system-name> .itotal | file-system-name | O número total de inodes no sistema de arquivos. | contagem | |||
| disco.<file-system-name> .iused | file-system-name | O número de inodes usados. | contagem | |||
| disco.<file-system-name> .iavail | file-system-name | O número de nós livres (não utilizados). | contagem | |||
| disco.<file-system-name> .iused_percentage | file-system-name | A porcentagem de inodes usados. | percentual | |||
| os.linux.metrics-system-disk-usage | disk_usage.<disk> .total | nome do disco | Quantidade total de espaço disponível neste disco | bytes | ||
| disk_usage.<disk> .usado | nome do disco | Quantidade total de espaço usado neste disco | bytes | |||
| disk_usage.<disk> .avail | nome do disco | Quantidade total de espaço disponível neste disco | bytes | |||
| disk_usage.<disk> .used_percentual | nome do disco | A porcentagem de espaço usado neste disco | percentual | sim | sim | |
| os.linux.metrics-system-memoryos.linux.metrics-system-memory-percent | memória.total | vazio | Total de RAM utilizável. | Base de conhecimento | ||
| memória.livre | vazio | Total de RAM livre. | Base de conhecimento | |||
| memória.disponível | vazio | Uma estimativa da quantidade de memória disponível para iniciar novas aplicações, sem troca. | Base de conhecimento | |||
| memória. buffers | vazio | Armazenamento temporário usado para blocos de disco brutos. | Base de conhecimento | |||
| memória.em cache | vazio | Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached. | Base de conhecimento | |||
| memória.swapTotal | vazio | Quantidade total de espaço de troca disponível. | Base de conhecimento | sim | sim | |
| memória.swapFree | vazio | Quantidade de espaço de troca que não está sendo usada no momento. | sim | sim | ||
| memória.dirty | vazio | Memória que está aguardando a gravação de volta no disco. | Base de conhecimento | |||
| memória.swapUsed | vazio | A quantidade de espaço de troca em uso. | Base de conhecimento | sim | sim | |
| memória.usada | vazio | A quantidade de RAM em uso. | Base de conhecimento | |||
| memory.usedWOBuffersCaches | vazio | A quantidade de memória em uso. | Base de conhecimento | |||
| memória.freeWOBuffersCaches | vazio | Valor de MemAvailable de /proc/meminfo se presente, mas retorna para adicionar memória livre + em buffer + em cache se não estiver. | Base de conhecimento | |||
| memória.swapUsedPercentage | vazio | Percentual do espaço de troca usado. | percentual | |||
| memory_percent.livre | vazio | Percentual de RAM livre | percentual | sim | sim | |
| memory_percent.disponível | vazio | Percentual de memória disponível | percentual | sim | sim | |
| memory_percent.buffers | vazio | Percentual de memória usada para blocos de disco brutos | percentual | sim | sim | |
| memory_percent.em cache | vazio | Percentual de memória usada para cache na memória para arquivos lidos do disco | percentual | sim | sim | |
| memory_percent.dirty | vazio | Percentual de memória aguardando para ser gravado de volta no disco. | percentual | sim | sim | |
| memory_percent.swapUsed | vazio | Percentual do espaço de troca usado. | percentual | sim | sim | |
| memory_percent.usedWOBuffersCaches | vazio | O percentual da memória está sendo usado | percentual | sim | sim | |
| memory_percent.freeWOBuffersCaches | vazio | Percentual de memória disponível | percentual | sim | sim | |
| os.linux.metrics-sistema-tempo de atividade | system.uptime(s) | vazio | A quantidade de tempo que o sistema está funcionando e disponível. | s | ||
| os.linux.metrics-memory-vmstat | vmstat.nr_free_pages | vazio | Páginas que não estão sendo usadas pelo sistema no momento. | páginas | ||
| vmstat.nr_alloc_batch | vazio | páginas alocadas a outros domínios devido à memória insuficiente em cada domínio de cada NUMA | páginas | |||
| vmstat.nr_inactive_anon | vazio | páginas de memória em cada domínio de cada nó NUMA que não são acessadas há muito tempo | páginas | |||
| vmstat.nr_active_ano | vazio | Páginas de memória virtual anônimas que foram usadas recentemente | Base de conhecimento | |||
| vmstat.nr_inactive_arquivo | vazio | A página de memória correspondente ao arquivo que não é acessado há muito tempo em cada domínio de cada NUMA. | Base de conhecimento | |||
| vmstat.nr_active_arquivo | vazio | A página de memória correspondente ao arquivo que foi acessado recentemente. | páginas | |||
| vmstat.nr_inevictable | vazio | O número de páginas está na lista de LRUs indespejáveis (sem) | contagem | |||
| vmstat.nr_mlock | vazio | Páginas mapeadas em um VMA VM_LOCKED - são uma classe de páginas que não podem ser removidas. | páginas | |||
| vmstat.nr_anon_páginas | vazio | Páginas mapeadas na memória que não fazem parte de um arquivo. | páginas | |||
| vmstat.nr_mapped | vazio | O número de páginas mapeadas na memória. | contagem | |||
| vmstat.nr_file_pages | vazio | |||||
| vmstat.nr_dirty | vazio | Páginas aguardando gravação no disco | páginas | |||
| vmstat.nr_writeback | vazio | Páginas que estão sendo gravadas em disco | páginas | |||
| vmstat.nr_slab_recuperável | vazio | Páginas do uso de memória do slab do kernel que podem ser recuperadas | páginas | |||
| vmstat.nr_slab_irrecuperável | vazio | Páginas do uso de memória do slab do kernel que não podem ser recuperadas | páginas | |||
| vmstat.nr_page_table_páginas | vazio | Páginas alocadas para tabelas de páginas | páginas | |||
| vmstat.nr_kernel_stack | vazio | Quantidade de memória alocada para pilhas de kernel. | Base de conhecimento | |||
| vmstat.nr_unstable | vazio | O número de páginas instáveis em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_bounce | vazio | |||||
| vmstat.nr_vmscan_write | vazio | O número de páginas sujas gravadas durante uma verificação de LRU(s) | contagem | |||
| vmstat.nr_vmscan_immediate_reclaim | vazio | |||||
| vmstat.nr_writeback_temp | vazio | |||||
| vmstat.nr_isolated_anon | vazio | O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_isolated_file | vazio | O número de páginas de armazenamento de arquivos isoladas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_shmem | vazio | O número de páginas de memória compartilhada | contagem | |||
| vmstat.nr_dirtied | vazio | O número de páginas sujas em cada domínio de cada nó NUMA | contagem | |||
| vmstat.nr_escrito | vazio | |||||
| vmstat.numa_hit | vazio | O número de páginas que foram alocadas com sucesso para este nó. | contagem | |||
| vmstat.numa_miss | vazio | O número de páginas que foram alocadas neste nó devido à pouca memória no nó pretendido. | contagem | |||
| vmstat.numa_estrangeiro | vazio | O número de páginas inicialmente destinadas a este nó que foram alocadas para outro nó. | contagem | |||
| vmstat.numa_intercalar | vazio | O número de páginas de política de intercalação alocadas com sucesso para este nó. | contagem | |||
| vmstat.numa_local | vazio | O número de páginas alocadas com sucesso neste nó, por um processo neste nó | contagem | |||
| vmstat.numa_outro | vazio | O número de páginas alocadas neste nó, por um processo em outro nó. | contagem | |||
| vmstat.workset_refault | vazio | |||||
| vmstat.workset_ativar | vazio | |||||
| vmstat.workset_nodereclaim | vazio | |||||
| vmstat.nr_anon_transparent_hugepages | vazio | |||||
| vmstat.nr_free_cma | vazio | Páginas do alocador de memória contínua livre em cada domínio de cada NUMA | ||||
| vmstat.nr_dirty_threshold | vazio | |||||
| vmstat.nr_dirty_background_threshold | vazio | |||||
| vmstat.pgpgin | vazio | O número de páginas trazidas do disco | contagem | |||
| vmstat.pgpgout | vazio | O número de páginas gravadas no disco | contagem | |||
| vmstat.pswpin | vazio | O número de páginas trazidas do espaço de troca | contagem | |||
| vmstat.pswpout | vazio | O número de páginas trocadas no espaço de troca | contagem | |||
| vmstat.pgalloc_dma | vazio | |||||
| vmstat.pgalloc_dma32 | vazio | |||||
| vmstat.pgalloc_normal | vazio | |||||
| vmstat.pgalloc_móvel | vazio | |||||
| vmstat.pglivre | vazio | O número de páginas livres desde a última inicialização | contagem | |||
| vmstat.pgativat | vazio | Número de ativações de página desde a última inicialização | contagem | |||
| vmstat.pgdesativar | vazio | Número de desativações de página desde a última inicialização | contagem | |||
| vmstat.pgfault | vazio | Falhas secundárias desde a última inicialização | páginas | |||
| vmstat.pgmajfault | vazio | Falhas graves desde a última inicialização | páginas | |||
| vmstat.pGLAZYFreed | vazio | |||||
| vmstat.pgrefill_dma | vazio | |||||
| vmstat.pgrefill_dma32 | vazio | |||||
| vmstat.pgrefill_normal | vazio | Número de reabastecimentos de página desde a última inicialização | contagem | |||
| vmstat.pgrefill_movable | vazio | |||||
| vmstat.pgsteal_kswapd_dma | vazio | |||||
| vmstat.pgsteal_kswapd_dma32 | vazio | |||||
| vmstat.pgsteal_kswapd_normal | vazio | |||||
| vmstat.pgsteal_kswapd_movable | vazio | |||||
| vmstat.pgsteal_direct_dma | vazio | |||||
| vmstat.pgsteal_direct_dma32 | vazio | |||||
| vmstat.pgsteal_direct_normal | vazio | |||||
| vmstat.pgsteal_direct_movable | vazio | |||||
| vmstat.pgscan_kswapd_dma | vazio | |||||
| vmstat.pgscan_kswapd_dma32 | vazio | |||||
| vmstat.pgscan_kswapd_normal | vazio | Número de páginas verificadas pelo kswapd desde a inicialização | contagem | |||
| vmstat.pgscan_kswapd_movable | vazio | |||||
| vmstat.pgscan_direct_dma | vazio | |||||
| vmstat.pgscan_direct_dma32 | vazio | |||||
| vmstat.pgscan_direct_normal | vazio | Número de páginas recuperadas desde a inicialização | contagem | |||
| vmstat.pgscan_direct_movable | vazio | |||||
| vmstat.pgscan_direct_throttle | vazio | |||||
| vmstat.zone_reclaim_failed | vazio | |||||
| vmstat.pginodesteal | vazio | |||||
| vmstat.slabs_scanned | vazio | |||||
| vmstat.kswapd_inodesteal | vazio | |||||
| vmstat.kswapd_low_wmark_hit_quickly | vazio | |||||
| vmstat.kswapd_high_wmark_hit_quickly | vazio | |||||
| vmstat.pageoutrun | vazio | Número de vezes que o kswapd chamou a recuperação da página | contagem | |||
| vmstat.allocstall | vazio | Número de vezes que a recuperação de página foi chamada diretamente (memória insuficiente) | contagem | |||
| vmstat.pgrotated | vazio | |||||
| vmstat.drop_pagecache | vazio | |||||
| vmstat.drop_slab | vazio | |||||
| vmstat.numa_pte_atualizações | vazio | |||||
| vmstat.numa_huge_pte_updates | vazio | |||||
| vmstat.numa_hint_falhas | vazio | |||||
| vmstat.numa_hint_faults_local | vazio | |||||
| vmstat.numa_pages_migrado | vazio | |||||
| vmstat.pgmigrate_success | vazio | |||||
| vmstat.pgmigrate_fail | vazio | |||||
| vmstat.compact_migrate_scanned | vazio | |||||
| vmstat.compact_free_scanned | vazio | |||||
| vmstat.compact_isolado | vazio | |||||
| vmstat.compact_stall | vazio | O número de vezes que um processo é interrompido para executar a compactação de memória para que uma página enorme fique livre para uso. | contagem | |||
| vmstat.compact_fail | vazio | O número de vezes que o sistema tenta compactar a memória, mas falha. | contagem | |||
| vmstat.compact_success | vazio | O número de vezes que o sistema compactou a memória e liberou uma página enorme para uso. | contagem | |||
| vmstat.htlb_buddy_alloc_success | vazio | |||||
| vmstat.htlb_buddy_alloc_fail | vazio | |||||
| vmstat.inevictable_pgs_culled | vazio | |||||
| vmstat.inevictable_pgs_scanned | vazio | |||||
| vmstat.inevictable_pgs_rescued | vazio | |||||
| vmstat.inevictable_pgs_mlocked | vazio | |||||
| vmstat.inevictable_pgs_munlocked | vazio | |||||
| vmstat.inevictable_pgs_cleared | vazio | |||||
| vmstat.unevictable_pgs_stranded | vazio | |||||
| vmstat.thp_fault_alloc | vazio | O número de páginas muito grandes foi alocado com sucesso para lidar com uma falha de página. | contagem | |||
| vmstat.thp_fault_Fallback | vazio | O número de falhas de página falha ao alocar uma página enorme e, em vez disso, volta a usar páginas pequenas. | contagem | |||
| vmstat.thp_collapse_alloc | vazio | O número de recolhimento de um intervalo de páginas em uma página enorme e, em seguida, a alocação bem-sucedida de uma nova página enorme para armazenar os dados. | contagem | |||
| vmstat.thp_collapse_alloc_failed | vazio | O número de recolhimento de um intervalo de páginas em uma página enorme, mas falhou na alocação. | contagem | |||
| vmstat.thp_split | vazio | O número de divisão de uma página enorme em páginas base | contagem | |||
| vmstat.thp_zero_page_alloc | vazio | O número de alocações bem-sucedidas da página zero enorme | contagem | |||
| vmstat.thp_zero_page_alloc_failed | vazio | O número de vezes que o kernel falhou ao alocar uma página zero enorme e voltou a usar páginas pequenas. | contagem | |||
| vmstat.balão_inflate | vazio | |||||
| vmstat.balão_deflacionar | vazio | |||||
| vmstat.balão_migrar | vazio | |||||
| os.linux.metrics-process-status | proc.<process> .VmSize | nome-do-processo | A quantidade total de memória virtual usada pelo processo | Base de conhecimento | ||
| proc.<process> .VmRSS | nome-do-processo | A memória física não trocada que um processo usou | Base de conhecimento | |||
| proc.<process> .VmSwap | nome-do-processo | A quantidade total de espaço de troca usado. | Base de conhecimento |
Verificações de monitoramento de rede do Linux
Nota:
Ao atualizar de uma versão anterior, adicione manualmente as verificações nesta tabela à política de métricas do Linux.
| Tipo | Verificação | Descrição | Uso e exemplo de uso | Métricas coletadas | Métrica em destaque |
|---|---|---|---|---|---|
| Métrica | os.linux.metrics-network-interface | Recupera todas as métricas relacionadas à interface de rede para servidores Linux. | Uso:
Exemplo de uso: |
|
sim |
| Métrica | os.linux.metrics-netstat-tcp | Recupera métricas nos estados do soquete TCP do netstat. Útil em servidores proxy ou da Web de alto tráfego com um grande número de conexões TCP de curta duração entrando e saindo. | Uso:
Exemplo de uso: |
|
não |