Linux verificações e políticas padrão

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 13 min. de leitura
  • Agent Client Collector fornece as seguintes verificações e políticas padrão para Linux monitoramento de métricas.

    Verificações de métricas de monitoramento do Linux

    Tabela 1. Política de métricas do Linux
    Verificação Nome de métrica Recurso Descrição Unidades Métrica em destaque Detecção de Anomalia
    os.linux.metrics-process-usage proc.acc.em execução nome-do-processo Número de processos em execução com este nome (acc) contagem
    proc.acc.cpuPercent nome-do-processo Porcentagem de CPU usada pelo processo. percentual

    proc.acc.​memPercentual

    nome-do-processo Porcentagem de memória usada pelo processo. percentual
    os.linux.metrics-reboot-count-today reiniciar.contagem.hoje vazio Número de reinicializações concluídas hoje contagem
    os.linux.metrics-system-cpu cpu.total.usuário total Processos normais em execução no modo de usuário; cpu.total.user é o total das métricas cpuN.user. contagem
    cpu.total.nice total Processos do ANS em execução no modo de usuário; cpu.total.nice é o total das métricas cpuN.nice. contagem
    cpu.total.sistema total Tempo gasto pela CPU na execução do kernel; cpu.total.system é o total de métricas cpuN.system. s
    cpu.total.idle total Total de tempo que a CPU gastou em um estado ocioso.; cpu.total.idle é o total de métricas cpuN.idle. s
    cpu.total.iowait total Tempo total que a CPU gastou aguardando a conclusão das operações de E/S. cpu.total.iowait é o total das métricas cpuN.iowait. s
    cpu.total.irq total Total de tempo que o processador está gastando no processamento de interrupções. cpu.total.irq é o total das métricas cpuN.irq. s
    cpu.total.softirq total Tempo gasto no atendimento a solicitações de interrupção de software; cpu.total.softirq é o total das métricas cpuN.softirq. s
    CPU.total.roubo total Tempo total que a CPU virtual gastou aguardando o hipervisor fazer a manutenção de outra CPU virtual. Aplica-se somente a máquinas virtuais. s
    cpu.total.convidado total Tempo total que a CPU gastou na execução do processador virtual. Aplica-se somente a hipervisores. s
    cpu.total.guest_nice total Tempo total que a CPU gastou na execução como um sistema operacional convidado. cpu.total.guset_nice si o total das métricas cpuN.guest_nice s
    CPU.<cpu-core> .usuário cpu-core Tempo gasto com processamento normal no modo de usuário. s
    CPU.<cpu-core> .nice cpu-core Tempo gasto com processos bem-sucedidos no modo de usuário. s
    CPU.<cpu-core> .sistema cpu-core Tempo gasto na execução no modo kernel. s
    CPU.<cpu-core> .idle cpu-core Tempo gasto em férias girando os polegares. s
    CPU.<cpu-core> .iowait cpu-core Tempo gasto aguardando a conclusão da E/S. Isso também é considerado tempo ocioso. s
    CPU.<cpu-core> .irq cpu-core Tempo gasto no atendimento a interrupções de hardware. s
    CPU.<cpu-core> .softirq cpu-core Tempo gasto no atendimento a interrupções de software. s
    CPU.<cpu-core> .roubo cpu-core Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual. s
    CPU.<cpu-core> .convidado cpu-core Tempo gasto na execução de uma CPU virtual ou SO convidado sob o controle do kernel. s
    CPU.<cpu-core> .guest_nice cpu-core Tempo total que a CPU gastou na execução como um sistema operacional convidado. s
    cpu.intr vazio Interrupções atendidas desde a inicialização. s
    cpu.ctxt vazio Número total de comutadores de contexto em todas as CPUs. contagem
    cpu.btime vazio A hora em que o sistema foi inicializado s
    cpu.processos vazio O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas do sistema fork() e clone(). contagem
    cpu.procs_running vazio O número total de processos em execução em todas as CPUs. contagem
    cpu.procs_blocked vazio O número de processos atualmente bloqueados, aguardando a conclusão da E/S. contagem
    cpu.cpu_count vazio Número de CPUs no sistema contagem
    CPU.<cpu-core> .núcleos cpu-core O número de núcleos de CPU contagem de núcleos
    os.linux.metrics-system-cpu-load load_avg.um vazio A carga média do sistema em um minuto. contagem de threads sim sim
    carga_média.cinco vazio A carga média do sistema ao longo de cinco minutos. contagem de threads sim sim
    méd_carga.quinze vazio A carga média do sistema ao longo de quinze minutos. contagem de threads sim sim
    load_avg.norm.one vazio A carga média do sistema em um minuto normalizada pelo número de CPUs. contagem de threads
    méd_carga.norm.cinco vazio A carga média do sistema ao longo de cinco minutos normalizada pelo número de CPUs. contagem de threads
    méd_carga.norm.quinze vazio A carga média do sistema ao longo de quinze minutos normalizada pelo número de CPUs. contagem de threads
    os.linux.metrics-system-cpu-percentage cpu.avgutilization_​percentage vazio Percentual da CPU usada em média percentual
    cpu.user_​percentual vazio Percentual de tempo total de CPU usado por processos normais no modo de usuário percentual sim sim
    cpu.nice_​percentual vazio Porcentagem de tempo de todas as cpus usadas por processos com atenção no modo de usuário percentual sim sim

    cpu.system_​percentual

    vazio O percentual de tempo gasto pela CPU na execução do kernel. percentual sim sim
    cpu.idle_percentage vazio Percentual de tempo em que todas as CPUs ficaram ociosas percentual sim sim

    cpu.iowait_​percentual

    vazio Percentual de tempo em que todas as CPUs aguardam a conclusão de E/S percentual sim sim
    cpu.irq_percentage vazio Percentual de tempo em que todas as interrupções de serviço da cpus percentual sim sim

    cpu.softirq_​percentual

    vazio Percentual de tempo em que todas as interrupções de software de manutenção de cpus percentual sim sim
    CPU.roubo_​percentual vazio Percentual de tempo em todos os sistemas operacionais de hosts virtuais atendidos pela cpus percentual sim sim
    cpu.guest_​percentual vazio Porcentagem de tempo de todos os sistemas operacionais convidados atendidos pela cpus percentual sim sim
    os.linux.metrics-system-disk disco.<disk-name> .leituras nome do disco Número total de leituras concluídas com sucesso. contagem sim sim
    disco.<disk-name> .readsMesclado nome do disco Número total de leituras mescladas contagem
    disco.<disk-name> .sectorsRead nome do disco Número total de setores lidos com sucesso. contagem
    disco.<disk-name> .readTime nome do disco Número total de milissegundos gastos em todas as leituras. milissegundos
    disco.<disk-name> .gravações nome do disco Número total de gravações concluídas com sucesso. contagem sim sim
    disco.<disk-name> .writesMesclado nome do disco Número total de gravações mescladas contagem
    disco.<disk-name> .sectorsWritten nome do disco Número total de setores gravados com sucesso. contagem
    disco.<disk-name> .writeTime nome do disco Número total de milissegundos gastos em todas as gravações. erronecessário
    disco.<disk-name> .ioInProgress nome do disco Número total de E/Ss em andamento no momento contagem
    disco.<disk-name> .ioTime Tempo total gasto em E/Ss milissegundos sim sim
    disco.<disk-name> .ioTimeWeighted nome do disco Total de tempo gasto em E/Ss. Isso pode fornecer uma medida fácil do tempo de conclusão de E/S e do backlog que pode estar se acumulando. milissegundos
    os.linux.metrics-system-disk-capacity disco.<file-system-name> .total file-system-name O tamanho total do sistema de arquivos. byte
    disco.<file-system-name> .usado file-system-name A quantidade total de espaço alocada para arquivos existentes no sistema de arquivos. byte
    disco.<file-system-name> .avail file-system-name A quantidade total de espaço disponível no sistema de arquivos. byte
    disco.<file-system-name> .used_percentage file-system-name A porcentagem do espaço disponível atualmente alocado para todos os arquivos no sistema de arquivos. percentual
    disco.<file-system-name> .itotal file-system-name O número total de inodes no sistema de arquivos. contagem
    disco.<file-system-name> .iused file-system-name O número de inodes usados. contagem
    disco.<file-system-name> .iavail file-system-name O número de nós livres (não utilizados). contagem
    disco.<file-system-name> .iused_percentage file-system-name A porcentagem de inodes usados. percentual
    os.linux.metrics-system-disk-usage disk_usage.<disk> .total nome do disco Quantidade total de espaço disponível neste disco bytes
    disk_usage.<disk> .usado nome do disco Quantidade total de espaço usado neste disco bytes
    disk_usage.<disk> .avail nome do disco Quantidade total de espaço disponível neste disco bytes
    disk_usage.<disk> .used_​percentual nome do disco A porcentagem de espaço usado neste disco percentual sim sim
    os.linux.metrics-system-memoryos.​linux.metrics-system-​memory-percent memória.total vazio Total de RAM utilizável. Base de conhecimento
    memória.livre vazio Total de RAM livre. Base de conhecimento
    memória.disponível vazio Uma estimativa da quantidade de memória disponível para iniciar novas aplicações, sem troca. Base de conhecimento
    memória. buffers vazio Armazenamento temporário usado para blocos de disco brutos. Base de conhecimento
    memória.em cache vazio Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached. Base de conhecimento
    memória.swapTotal vazio Quantidade total de espaço de troca disponível. Base de conhecimento sim sim
    memória.swapFree vazio Quantidade de espaço de troca que não está sendo usada no momento. sim sim
    memória.dirty vazio Memória que está aguardando a gravação de volta no disco. Base de conhecimento
    memória.swapUsed vazio A quantidade de espaço de troca em uso. Base de conhecimento sim sim
    memória.usada vazio A quantidade de RAM em uso. Base de conhecimento
    memory.​usedWOBuffersCaches vazio A quantidade de memória em uso. Base de conhecimento
    memória.​freeWOBuffersCaches vazio Valor de MemAvailable de /proc/meminfo se presente, mas retorna para adicionar memória livre + em buffer + em cache se não estiver. Base de conhecimento
    memória.​swapUsedPercentage vazio Percentual do espaço de troca usado. percentual
    memory_percent.​livre vazio Percentual de RAM livre percentual sim sim
    memory_percent.​disponível vazio Percentual de memória disponível percentual sim sim
    memory_percent.​buffers vazio Percentual de memória usada para blocos de disco brutos percentual sim sim
    memory_percent.​em cache vazio Percentual de memória usada para cache na memória para arquivos lidos do disco percentual sim sim
    memory_percent.​dirty vazio Percentual de memória aguardando para ser gravado de volta no disco. percentual sim sim
    memory_percent.​swapUsed vazio Percentual do espaço de troca usado. percentual sim sim
    memory_percent.​usedWOBuffersCaches vazio O percentual da memória está sendo usado percentual sim sim
    memory_percent.​freeWOBuffersCaches vazio Percentual de memória disponível percentual sim sim
    os.linux.metrics-​sistema-tempo de atividade system.uptime(s) vazio A quantidade de tempo que o sistema está funcionando e disponível. s
    os.linux.metrics-​memory-vmstat vmstat.nr_free_pages vazio Páginas que não estão sendo usadas pelo sistema no momento. páginas
    vmstat.nr_alloc_​batch vazio páginas alocadas a outros domínios devido à memória insuficiente em cada domínio de cada NUMA páginas
    vmstat.nr_​inactive_anon vazio páginas de memória em cada domínio de cada nó NUMA que não são acessadas há muito tempo páginas
    vmstat.nr_active_​ano vazio Páginas de memória virtual anônimas que foram usadas recentemente Base de conhecimento
    vmstat.nr_inactive_​arquivo vazio A página de memória correspondente ao arquivo que não é acessado há muito tempo em cada domínio de cada NUMA. Base de conhecimento
    vmstat.nr_active_​arquivo vazio A página de memória correspondente ao arquivo que foi acessado recentemente. páginas
    vmstat.nr_​inevictable vazio O número de páginas está na lista de LRUs indespejáveis (sem) contagem
    vmstat.nr_​mlock vazio Páginas mapeadas em um VMA VM_LOCKED - são uma classe de páginas que não podem ser removidas. páginas
    vmstat.nr_anon_​páginas vazio Páginas mapeadas na memória que não fazem parte de um arquivo. páginas
    vmstat.nr_​mapped vazio O número de páginas mapeadas na memória. contagem
    vmstat.nr_file_​pages vazio
    vmstat.nr_​dirty vazio Páginas aguardando gravação no disco páginas
    vmstat.nr_​writeback vazio Páginas que estão sendo gravadas em disco páginas
    vmstat.nr_slab_​recuperável vazio Páginas do uso de memória do slab do kernel que podem ser recuperadas páginas
    vmstat.nr_slab_​irrecuperável vazio Páginas do uso de memória do slab do kernel que não podem ser recuperadas páginas
    vmstat.nr_page_table_​páginas vazio Páginas alocadas para tabelas de páginas páginas
    vmstat.nr_kernel_​stack vazio Quantidade de memória alocada para pilhas de kernel. Base de conhecimento
    vmstat.nr_unstable vazio O número de páginas instáveis em cada domínio de cada nó NUMA contagem
    vmstat.nr_bounce vazio
    vmstat.nr_vmscan_​write vazio O número de páginas sujas gravadas durante uma verificação de LRU(s) contagem
    vmstat.nr_vmscan_​immediate_reclaim vazio
    vmstat.nr_writeback_​temp vazio
    vmstat.nr_isolated_​anon vazio O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA contagem
    vmstat.nr_​isolated_file vazio O número de páginas de armazenamento de arquivos isoladas em cada domínio de cada nó NUMA contagem
    vmstat.nr_shmem vazio O número de páginas de memória compartilhada contagem
    vmstat.nr_dirtied vazio O número de páginas sujas em cada domínio de cada nó NUMA contagem
    vmstat.nr_escrito vazio
    vmstat.numa_hit vazio O número de páginas que foram alocadas com sucesso para este nó. contagem
    vmstat.numa_miss vazio O número de páginas que foram alocadas neste nó devido à pouca memória no nó pretendido. contagem
    vmstat.numa_​estrangeiro vazio O número de páginas inicialmente destinadas a este nó que foram alocadas para outro nó. contagem
    vmstat.numa_​intercalar vazio O número de páginas de política de intercalação alocadas com sucesso para este nó. contagem
    vmstat.numa_local vazio O número de páginas alocadas com sucesso neste nó, por um processo neste nó contagem
    vmstat.numa_outro vazio O número de páginas alocadas neste nó, por um processo em outro nó. contagem
    vmstat.workset_​refault vazio
    vmstat.workset_​ativar vazio
    vmstat.workset_​nodereclaim vazio
    vmstat.nr_anon_transparent_​hugepages vazio
    vmstat.nr_free_cma vazio Páginas do alocador de memória contínua livre em cada domínio de cada NUMA
    vmstat.nr_dirty_​threshold vazio
    vmstat.nr_dirty_background_threshold vazio
    vmstat.pgpgin vazio O número de páginas trazidas do disco contagem
    vmstat.pgpgout vazio O número de páginas gravadas no disco contagem
    vmstat.pswpin vazio O número de páginas trazidas do espaço de troca contagem
    vmstat.pswpout vazio O número de páginas trocadas no espaço de troca contagem
    vmstat.pgalloc_dma vazio
    vmstat.pgalloc_​dma32 vazio
    vmstat.pgalloc_​normal vazio
    vmstat.pgalloc_​móvel vazio
    vmstat.pglivre vazio O número de páginas livres desde a última inicialização contagem
    vmstat.pgativat vazio Número de ativações de página desde a última inicialização contagem
    vmstat.pgdesativar vazio Número de desativações de página desde a última inicialização contagem
    vmstat.pgfault vazio Falhas secundárias desde a última inicialização páginas
    vmstat.pgmajfault vazio Falhas graves desde a última inicialização páginas
    vmstat.pGLAZYFreed vazio
    vmstat.pgrefill_dma vazio
    vmstat.pgrefill_dma32 vazio
    vmstat.pgrefill_normal vazio Número de reabastecimentos de página desde a última inicialização contagem
    vmstat.pgrefill_​movable vazio
    vmstat.pgsteal_​kswapd_dma vazio
    vmstat.pgsteal_​kswapd_dma32 vazio
    vmstat.pgsteal_​kswapd_normal vazio
    vmstat.pgsteal_​kswapd_movable vazio
    vmstat.pgsteal_​direct_dma vazio
    vmstat.pgsteal_​direct_dma32 vazio
    vmstat.pgsteal_​direct_normal vazio
    vmstat.pgsteal_direct_movable vazio
    vmstat.pgscan_​kswapd_dma vazio
    vmstat.pgscan_​kswapd_dma32 vazio
    vmstat.pgscan_​kswapd_normal vazio Número de páginas verificadas pelo kswapd desde a inicialização contagem
    vmstat.pgscan_​kswapd_movable vazio
    vmstat.pgscan_​direct_dma vazio
    vmstat.pgscan_​direct_dma32 vazio
    vmstat.pgscan_direct_normal vazio Número de páginas recuperadas desde a inicialização contagem
    vmstat.pgscan_direct_movable vazio
    vmstat.pgscan_direct_throttle vazio
    vmstat.zone_​reclaim_failed vazio
    vmstat.pginodesteal vazio
    vmstat.slabs_scanned vazio
    vmstat.kswapd_​inodesteal vazio
    vmstat.kswapd_low_​wmark_hit_quickly vazio
    vmstat.kswapd_high_​wmark_hit_quickly vazio
    vmstat.pageoutrun vazio Número de vezes que o kswapd chamou a recuperação da página contagem
    vmstat.allocstall vazio Número de vezes que a recuperação de página foi chamada diretamente (memória insuficiente) contagem
    vmstat.pgrotated vazio
    vmstat.drop_​pagecache vazio
    vmstat.drop_​slab vazio
    vmstat.numa_pte_​atualizações vazio
    vmstat.numa_huge_​pte_updates vazio
    vmstat.numa_hint_​falhas vazio
    vmstat.numa_hint_​faults_local vazio
    vmstat.numa_pages_​migrado vazio
    vmstat.pgmigrate_​success vazio
    vmstat.pgmigrate_fail vazio
    vmstat.compact_​migrate_scanned vazio
    vmstat.compact_​free_scanned vazio
    vmstat.compact_​isolado vazio
    vmstat.compact_​stall vazio O número de vezes que um processo é interrompido para executar a compactação de memória para que uma página enorme fique livre para uso. contagem
    vmstat.compact_fail vazio O número de vezes que o sistema tenta compactar a memória, mas falha. contagem
    vmstat.compact_​success vazio O número de vezes que o sistema compactou a memória e liberou uma página enorme para uso. contagem
    vmstat.htlb_buddy_​alloc_success vazio
    vmstat.htlb_buddy_​alloc_fail vazio
    vmstat.inevictable_​pgs_culled vazio
    vmstat.inevictable_​pgs_scanned vazio
    vmstat.inevictable_​pgs_rescued vazio
    vmstat.inevictable_​pgs_mlocked vazio
    vmstat.inevictable_​pgs_munlocked vazio
    vmstat.inevictable_​pgs_cleared vazio
    vmstat.unevictable_​pgs_stranded vazio
    vmstat.thp_fault_alloc vazio O número de páginas muito grandes foi alocado com sucesso para lidar com uma falha de página. contagem
    vmstat.thp_fault_​Fallback vazio O número de falhas de página falha ao alocar uma página enorme e, em vez disso, volta a usar páginas pequenas. contagem
    vmstat.thp_collapse_alloc vazio O número de recolhimento de um intervalo de páginas em uma página enorme e, em seguida, a alocação bem-sucedida de uma nova página enorme para armazenar os dados. contagem
    vmstat.thp_collapse_​alloc_failed vazio O número de recolhimento de um intervalo de páginas em uma página enorme, mas falhou na alocação. contagem
    vmstat.thp_split vazio O número de divisão de uma página enorme em páginas base contagem
    vmstat.thp_zero_page_alloc vazio O número de alocações bem-sucedidas da página zero enorme contagem
    vmstat.thp_zero_page_alloc_failed vazio O número de vezes que o kernel falhou ao alocar uma página zero enorme e voltou a usar páginas pequenas. contagem
    vmstat.balão_inflate vazio
    vmstat.balão_​deflacionar vazio
    vmstat.balão_​migrar vazio
    os.linux.metrics-process-status proc.<process> .VmSize nome-do-processo A quantidade total de memória virtual usada pelo processo Base de conhecimento
    proc.<process> .VmRSS nome-do-processo A memória física não trocada que um processo usou Base de conhecimento
    proc.<process> .VmSwap nome-do-processo A quantidade total de espaço de troca usado. Base de conhecimento

    Verificações de monitoramento de rede do Linux

    Nota:
    Ao atualizar de uma versão anterior, adicione manualmente as verificações nesta tabela à política de métricas do Linux.
    Tabela 2. Política de métricas do Linux
    Tipo Verificação Descrição Uso e exemplo de uso Métricas coletadas Métrica em destaque
    Métrica os.linux.metrics-network-interface Recupera todas as métricas relacionadas à interface de rede para servidores Linux.
    Uso:
    • -x, excludeinterface: lista de interfaces a serem excluídas (separadas por vírgulas)
    • -i, includeinterface: lista de interfaces a serem incluídas (separadas por vírgulas)
    • -I, includeinterfaceregex: interfaces correspondentes de Regex a serem incluídas
    • -X, excludeinterfaceregex: interfaces correspondentes de Regex a serem excluídas

    Exemplo de uso: command:metrics-network-interface.rb

    • rxBytes (métrica em destaque)
    • rxPackets (métrica em destaque)
    • rxErros
    • rxDrops (métrica em destaque)
    • rxFifo
    • rxFrame
    • rxcompactado
    • rxMulticast
    • rxBytes (métrica em destaque)
    • rxPackets (métrica em destaque)
    • rxErros
    • rxDrops (métrica em destaque)
    • rxFifo
    • rxColls
    • rxCarrier
    • rxcompactado
    sim
    Métrica os.linux.metrics-netstat-tcp Recupera métricas nos estados do soquete TCP do netstat. Útil em servidores proxy ou da Web de alto tráfego com um grande número de conexões TCP de curta duração entrando e saindo.
    Uso:
    • -p, porta: a porta da qual você deseja receber métricas. Intervalo de valores = 1-65535.
    • -t, type: o tipo de porta da qual as métricas serão recebidas. Valores=local ou remoto. Padrão = local
    • -d, disabletcp6: desabilita a verificação de TCP6. Insira um valor para definir disabletcp6 = verdadeiro.

    Exemplo de uso: metrics-netstat-tcp.rb

    • tcp.DESCONHECIDO
    • tcp.ESTABELECIDO
    • tcp.SYN_SENT
    • tcp.SYN_RECV
    • tcp.FIN_WAIT1
    • tcp.FIN_WAIT2
    • tcp.TIME_WAIT
    • tcp.ENCERRAR
    • tcp.CLOSE_WAIT
    • tcp.LAST_ACK
    • tcp.OUVIR
    • tcp.ENCERRAMENTO
    não