Linux verificações e políticas padrão

  • Versão de lançamento: Xanadu
  • Atualizado 1 de ago. de 2024
  • 13 min. de leitura
  • Agent Client Collector fornece as seguintes verificações e políticas padrão para Linux monitoramento de métricas.

    Verificações de métricas de monitoramento do Linux

    Tabela 1. Política de métricas do Linux
    Verificação Nome de métrica Recurso Descrição Unidades Métrica em destaque Detecção de Anomalia
    os.linux.metrics-process-usage proc.acc.em execução process-name Número de processos em execução com este nome (acc) contagem
    proc.acc.cpuPercent process-name Percentual de cpu usado pelo processo. porcentagem

    proc.acc.​memPercent

    process-name Porcentagem de memória usada pelo processo. porcentagem
    os.linux.metrics-reboot-count-today reboot.count.today vazio Número de reinicializações concluídas hoje contagem
    os.linux.metrics-system-cpu cpu.total.usuário total Processos normais em execução no modo de usuário; cpu.total.user é o total das métricas cpuN.user. contagem
    cpu.total.nice total Processos do NICE em execução no modo de usuário; cpu.total.nice é o total das métricas cpuN.nice. contagem
    cpu.total.sistema total Tempo gasto pela CPU na execução do kernel; cpu.total.system é o total das métricas cpuN.system. s
    cpu.total.idle total Tempo total que a CPU gastou em um estado ocioso.; cpu.total.idle é o total de métricas cpuN.idle. s
    cpu.total.iowait total Tempo total que a CPU gastou aguardando a conclusão das operações de E/S. cpu.total.iowait é o total das métricas cpuN.iowait. s
    cpu.total.irq total Total de tempo que o processador está gastando para lidar com Interrupções.; cpu.total.irq é o total das métricas cpuN.irq. s
    cpu.total.softirq total Tempo gasto no atendimento de solicitações de interrupção flexível; cpu.total.softirq é o total das métricas cpuN.softirq. s
    cpu.total.roubo total Tempo total que a CPU virtual gastou aguardando o hipervisor atender a outra CPU virtual. Aplica-se somente a máquinas virtuais. s
    cpu.total.convidado total Tempo total que a CPU gastou executando o processador virtual. Aplica-se somente a hipervisores. s
    cpu.total.convidado_nice total Tempo total que a CPU gastou executando como SO convidado. cpu.total.guset_nice é o total das métricas cpuN.guest_nice s
    cpu.<cpu-core> .usuário cpu-core Tempo gasto com processamento normal no modo de usuário. s
    cpu.<cpu-core> .agradável cpu-core Tempo gasto com processos de limpeza no modo de usuário. s
    cpu.<cpu-core> .sistema cpu-core Tempo gasto na execução no modo kernel. s
    cpu.<cpu-core> .ocioso cpu-core Tempo gasto em férias girando os polegares. s
    cpu.<cpu-core> .iowait cpu-core Tempo gasto aguardando a conclusão de E/S. Isso também é considerado tempo ocioso. s
    cpu.<cpu-core> .irq cpu-core Tempo gasto no atendimento a interrupções de hardware. s
    cpu.<cpu-core> .softirq cpu-core Tempo gasto no atendimento a interrupções de software. s
    cpu.<cpu-core> .roubo cpu-core Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual. s
    cpu.<cpu-core> .convidado cpu-core Tempo gasto na execução de uma CPU virtual ou SO convidado sob o controle do kernel. s
    cpu.<cpu-core> .convidado_nice cpu-core Tempo total que a CPU gastou executando como SO convidado. s
    cpu.intr vazio Interrupções atendidas desde o momento da inicialização. s
    cpu.ctxt vazio Número total de comutadores de contexto em todas as CPUs. contagem
    cpu.btime vazio A hora em que o sistema foi inicializado s
    cpu.processos vazio O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas de sistema fork() e clone(). contagem
    cpu.procs_running vazio O número total de processos em execução em todas as CPUs. contagem
    cpu.procs_blocked vazio O número de processos bloqueados no momento, aguardando a conclusão da E/S. contagem
    cpu.cpu_count vazio Número de cpu no sistema contagem
    cpu.<cpu-core> .cores cpu-core O número de núcleos de CPU contagem de núcleos
    os.linux.metrics-system-cpu-load load_avg.one vazio A carga média do sistema em um minuto. contagem de threads sim sim
    carga_média.cinco vazio A carga média do sistema em cinco minutos. contagem de threads sim sim
    carga_média.quinze vazio A carga média do sistema em quinze minutos. contagem de threads sim sim
    load_avg.norm.one vazio A carga média do sistema em um minuto normalizada pelo número de CPUs. contagem de threads
    load_avg.norm.cinco vazio A carga média do sistema ao longo de cinco minutos normalizada pelo número de CPUs. contagem de threads
    load_avg.norm.quinze vazio A carga média do sistema ao longo de quinze minutos normalizada pelo número de CPUs. contagem de threads
    os.linux.metrics-system-cpu-percentage cpu.avgutilization_​porcentagem vazio Percentual de cpu foi usado em média porcentagem
    cpu.user_​porcentagem vazio Porcentagem de tempo total de cpu usada por processos normais no modo de usuário porcentagem sim sim
    cpu.nice_​porcentagem vazio Percentual de tempo em que todas as CPUs são usadas por processos limpos no modo de usuário porcentagem sim sim

    cpu.system_​porcentagem

    vazio A porcentagem de tempo que a CPU gastou na execução do kernel. porcentagem sim sim
    cpu.idle_percentage vazio Percentual de tempo em que todas as CPUs ficaram ociosas porcentagem sim sim

    cpu.iowait_​porcentagem

    vazio Percentual de tempo em que todas as CPUs aguardam a conclusão de E/S porcentagem sim sim
    cpu.irq_porcentagem vazio Percentual de tempo de interrupções de serviço de cpus porcentagem sim sim

    cpu.softirq_​porcentagem

    vazio Percentual de tempo de interrupções de software de serviço de cpus porcentagem sim sim
    cpu.steal_percentage vazio Percentual de tempo em que todos os sistemas operacionais de hosts virtuais atendidos por cpus porcentagem sim sim
    cpu.convidado_​porcentagem vazio Percentual de tempo em que todas as CPUs do sistema operacional convidado foram atendidas porcentagem sim sim
    os.linux.metrics-system-disk disco.<disk-name> .leituras nome-disco Número total de leituras concluídas com sucesso. contagem sim sim
    disco.<disk-name> .readsMerged nome-disco Número total de leituras mescladas contagem
    disco.<disk-name> .sectorsLeitura nome-disco Número total de setores lidos com sucesso. contagem
    disco.<disk-name> .readTime nome-disco Número total de milissegundos gastos por todas as leituras. milissegundos
    disco.<disk-name> .gravações nome-disco Número total de gravações concluídas com sucesso. contagem sim sim
    disco.<disk-name> .writesMerged nome-disco Número total de gravações mescladas contagem
    disco.<disk-name> .setoresGravados nome-disco Número total de setores gravados com sucesso. contagem
    disco.<disk-name> .writeTime nome-disco Número total de milissegundos gastos por todas as gravações. erro de segundo
    disco.<disk-name> .ioInProgress nome-disco Número total de E/Ss em andamento no momento contagem
    disco.<disk-name> .ioTime Total de tempo gasto fazendo E/Ss milissegundos sim sim
    disco.<disk-name> .ioTimeWeighted nome-disco Tempo total gasto em E/Ss. Isso pode fornecer uma medida fácil do tempo de conclusão de E/S e do backlog que pode estar se acumulando. milissegundos
    os.linux.metrics-system-disk-capacity disco.<file-system-name> .total file-system-name O tamanho total do sistema de arquivos. byte
    disco.<file-system-name> .usado file-system-name A quantidade total de espaço alocado para arquivos existentes no sistema de arquivos. byte
    disco.<file-system-name> .disponível file-system-name A quantidade total de espaço disponível no sistema de arquivos. byte
    disco.<file-system-name> .used_percentage file-system-name A porcentagem do espaço disponível atualmente alocado para todos os arquivos no sistema de arquivos. porcentagem
    disco.<file-system-name> .itotal file-system-name O número total de nós no sistema de arquivos. contagem
    disco.<file-system-name> .usado file-system-name O número de nós usados. contagem
    disco.<file-system-name> .ivail file-system-name O número de nós livres (não utilizados). contagem
    disco.<file-system-name> .used_percentage file-system-name A porcentagem de nós usados. porcentagem
    os.linux.metrics-system-disk-usage disk_usage.<disk> .total nome-disco Quantidade total de espaço disponível neste disco bytes
    disk_usage.<disk> .usado nome-disco Quantidade total de espaço usado neste disco bytes
    disk_usage.<disk> .disponível nome-disco Quantidade total de espaço disponível neste disco bytes
    disk_usage.<disk> .used_​porcentagem nome-disco A porcentagem de espaço usada neste disco porcentagem sim sim
    os.linux.metrics-system-memoryos.​linux.metrics-system-​memory-percent memória.total vazio Total de RAM utilizável. Base de conhecimento
    memória.livre vazio Total de RAM livre. Base de conhecimento
    memória.disponível vazio Uma estimativa da quantidade de memória disponível para iniciar novas aplicações, sem troca. Base de conhecimento
    memória. buffers vazio Armazenamento temporário usado para blocos de disco bruto. Base de conhecimento
    memória.cache vazio Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached. Base de conhecimento
    memory.swapTotal vazio Quantidade total de espaço de troca disponível. Base de conhecimento sim sim
    memória.swapLivre vazio Quantidade de espaço de troca que não está sendo usada no momento. sim sim
    memória.suja vazio Memória que está aguardando para ser gravada de volta no disco. Base de conhecimento
    memória.swapUsado vazio A quantidade de espaço de troca em uso. Base de conhecimento sim sim
    memória.usada vazio A quantidade de RAM em uso. Base de conhecimento
    memory.​usedWOBuffersCaches vazio A quantidade de memória em uso. Base de conhecimento
    memory.​freeWOBuffersCaches vazio Valor de MemAvailable de /proc/meminfo se presente, mas retorna para adicionar memória livre + em buffer + em cache se não estiver. Base de conhecimento
    memory.​swapUsedPercentage vazio Percentual de espaço de troca usado. porcentagem
    memory_percent.​livre vazio Percentual de RAM livre porcentagem sim sim
    memory_percent.​disponível vazio Percentual de memória disponível porcentagem sim sim
    memory_percent.​ buffers vazio Percentual de memória usado para blocos de disco bruto porcentagem sim sim
    memory_percent.​em cache vazio Percentual de memória usada para cache na memória para arquivos lidos do disco porcentagem sim sim
    memory_percent.​sujo vazio Percentual de memória aguardando para ser gravado de volta no disco. porcentagem sim sim
    memory_percent.​swapUsed vazio Percentual de espaço de troca usado. porcentagem sim sim
    memory_percent.​usedWOBuffersCaches vazio A porcentagem de memória está sendo usada porcentagem sim sim
    memory_percent.​freeWOBuffersCaches vazio Percentual de memória disponível porcentagem sim sim
    os.linux.metrics-​system-uptime system.uptime(s) vazio A quantidade de tempo em que o sistema está funcionando e disponível. s
    os.linux.metrics-​memory-vmstat vmstat.nr_free_pages vazio Páginas que não estão sendo usadas pelo sistema no momento. páginas
    vmstat.nr_alloc_​batch vazio páginas alocadas a outros domínios devido à memória insuficiente em cada domínio de cada NUMA páginas
    vmstat.nr_​inactive_anon vazio páginas de memória em cada domínio de cada nó NUMA que não são acessadas há muito tempo páginas
    vmstat.nr_active_​anon vazio Páginas de memória virtual anônima que foram usadas recentemente Base de conhecimento
    vmstat.nr_inactive_​arquivo vazio A página de memória correspondente ao arquivo que não é acessado há muito tempo em cada domínio de cada NUMA. Base de conhecimento
    vmstat.nr_ativo_​arquivo vazio A página de memória correspondente ao arquivo que foi acessado recentemente. páginas
    vmstat.nr_​unvictable vazio O número de páginas está na lista LRU (sem) indesejável contagem
    vmstat.nr_​mlock vazio Páginas mapeadas em um VMA VM_LOCKED - são uma classe de páginas que não podem ser removidas. páginas
    vmstat.nr_anon_​pages vazio Páginas mapeadas na memória que não fazem parte de um arquivo. páginas
    vmstat.nr_​mapped vazio O número de páginas mapeadas de memória. contagem
    vmstat.nr_file_​pages vazio
    vmstat.nr_​dirty vazio Páginas aguardando gravação no disco páginas
    vmstat.nr_​writeback vazio Páginas sendo gravadas no momento no disco páginas
    vmstat.nr_slab_​recuperável vazio Páginas do uso de memória de slab do kernel que podem ser recuperadas páginas
    vmstat.nr_slab_​irrecuperável vazio Páginas do uso de memória de slab do kernel que não podem ser recuperadas páginas
    vmstat.nr_page_table_​pages vazio Páginas alocadas para tabelas de páginas páginas
    vmstat.nr_kernel_​stack vazio Quantidade de memória alocada para pilhas de kernel. Base de conhecimento
    vmstat.nr_unstable vazio O número de páginas instáveis em cada domínio de cada nó NUMA contagem
    vmstat.nr_bounce vazio
    vmstat.nr_vmscan_​write vazio O número de páginas sujas gravadas durante uma verificação de LRU(s) contagem
    vmstat.nr_vmscan_​immediate_reclaim vazio
    vmstat.nr_writeback_​temp vazio
    vmstat.nr_isolated_​anon vazio O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA contagem
    vmstat.nr_​isolated_file vazio O número de páginas de armazenamento de arquivos isoladas em cada domínio de cada nó NUMA contagem
    vmstat.nr_shmem vazio O número de páginas de memória compartilhada contagem
    vmstat.nr_dirtied vazio O número de páginas sujas em cada domínio de cada nó NUMA contagem
    vmstat.nr_escrito vazio
    vmstat.numa_hit vazio O número de páginas que foram alocadas com sucesso para este nó. contagem
    vmstat.numa_miss vazio O número de páginas que foram alocadas neste nó devido à pouca memória no nó pretendido. contagem
    vmstat.numa_​estrangeiro vazio O número de páginas inicialmente destinadas a este nó que foram alocadas para outro nó. contagem
    vmstat.numa_​intercalado vazio O número de páginas de política intercaladas alocadas com sucesso para este nó. contagem
    vmstat.numa_local vazio O número de páginas alocadas com sucesso neste nó, por um processo neste nó contagem
    vmstat.numa_outros vazio O número de páginas alocadas neste nó por um processo em outro nó. contagem
    vmstat.workset_​refault vazio
    vmstat.workset_​ativar vazio
    vmstat.workset_​nodereclaim vazio
    vmstat.nr_anon_transparent_​hugepages vazio
    vmstat.nr_free_cma vazio Páginas do alocador de memória contínua livre em cada domínio de cada NUMA
    vmstat.nr_dirty_​threshold vazio
    vmstat.nr_dirty_background_threshold vazio
    vmstat.pgpgin vazio O número de páginas trazidas do disco contagem
    vmstat.pgpgout vazio O número de páginas gravadas no disco contagem
    vmstat.pswpin vazio O número de páginas trazidas do espaço de troca contagem
    vmstat.pswpout vazio O número de páginas trocadas no espaço de troca contagem
    vmstat.pgalloc_dma vazio
    vmstat.pgalloc_​dma32 vazio
    vmstat.pgalloc_​normal vazio
    vmstat.pgalloc_​movable vazio
    vmstat.pglivre vazio O número de páginas livres desde a última inicialização contagem
    vmstat.pgactivat vazio Número de ativações de página desde a última inicialização contagem
    vmstat.pgdesativar vazio Número de desativações de página desde a última inicialização contagem
    vmstat.pgfault vazio Falhas secundárias desde a última inicialização páginas
    vmstat.pgmajfault vazio Falhas graves desde a última inicialização páginas
    vmstat.pglazyfreed vazio
    vmstat.pgrefill_dma vazio
    vmstat.pgrefill_dma32 vazio
    vmstat.pgrefill_normal vazio Número de reabastecimentos de página desde a última inicialização contagem
    vmstat.pgrefill_​movable vazio
    vmstat.pgsteal_​kswapd_dma vazio
    vmstat.pgsteal_​kswapd_dma32 vazio
    vmstat.pgsteal_​kswapd_normal vazio
    vmstat.pgsteal_​kswapd_movable vazio
    vmstat.pgsteal_​direct_dma vazio
    vmstat.pgsteal_​direct_dma32 vazio
    vmstat.pgsteal_​direct_normal vazio
    vmstat.pgsteal_​direct_movable vazio
    vmstat.pgscan_​kswapd_dma vazio
    vmstat.pgscan_​kswapd_dma32 vazio
    vmstat.pgscan_​kswapd_normal vazio Número de páginas verificadas pelo kswapd desde a inicialização contagem
    vmstat.pgscan_​kswapd_movable vazio
    vmstat.pgscan_​direct_dma vazio
    vmstat.pgscan_​direct_dma32 vazio
    vmstat.pgscan_​direct_normal vazio Número de páginas recuperadas desde a inicialização contagem
    vmstat.pgscan_​direct_movable vazio
    vmstat.pgscan_​direct_throttle vazio
    vmstat.zone_​reclaim_failed vazio
    vmstat.pginodesteal vazio
    vmstat.slabs_scanned vazio
    vmstat.kswapd_​inodesteal vazio
    vmstat.kswapd_low_​wmark_hit_quickly vazio
    vmstat.kswapd_high_​wmark_hit_quickly vazio
    vmstat.pageoutrun vazio Número de vezes que o kswapd acionou a recuperação de página contagem
    vmstat.allocstall vazio Número de vezes que a recuperação de página foi chamada diretamente (memória baixa) contagem
    vmstat.pgrotated vazio
    vmstat.drop_pagecache vazio
    vmstat.drop_​slab vazio
    vmstat.numa_pte_​updates vazio
    vmstat.numa_huge_​pte_updates vazio
    vmstat.numa_hint_​falhas vazio
    vmstat.numa_hint_​faults_local vazio
    vmstat.numa_pages_​migred vazio
    vmstat.pgmigrate_​sucesso vazio
    vmstat.pgmigrate_fail vazio
    vmstat.compact_​migrate_scanned vazio
    vmstat.compact_​free_scanned vazio
    vmstat.compact_​isolado vazio
    vmstat.compact_​stall vazio O número de vezes que um processo é interrompido para executar a compactação de memória para que uma página enorme esteja livre para uso. contagem
    vmstat.compact_fail vazio O número de vezes que o sistema tentou compactar a memória, mas falhou. contagem
    vmstat.compact_​sucesso vazio O número de vezes que o sistema compactou a memória e liberou uma página enorme para uso. contagem
    vmstat.htlb_buddy_​alloc_success vazio
    vmstat.htlb_buddy_​alloc_fail vazio
    vmstat.unevictable_​pgs_culled vazio
    vmstat.unevictable_​pgs_scanned vazio
    vmstat.unevictable_​pgs_rescued vazio
    vmstat.unevictable_​pgs_mlocked vazio
    vmstat.unevictable_​pgs_munlocked vazio
    vmstat.unevictable_​pgs_cleared vazio
    vmstat.unevictable_​pgs_stranded vazio
    vmstat.thp_fault_alloc vazio O número de páginas enormes foi alocado com sucesso para lidar com uma falha de página. contagem
    vmstat.thp_fault_​Fallback vazio O número de falhas de página falha ao alocar uma página enorme e, em vez disso, volta a usar páginas pequenas. contagem
    vmstat.thp_collapse_alloc vazio O número de recolhimentos de um intervalo de páginas em uma página enorme e, em seguida, a alocação bem-sucedida de uma nova página enorme para armazenar os dados. contagem
    vmstat.thp_collapse_​alloc_failed vazio O número de recolhimentos de um intervalo de páginas em uma página enorme, mas com falha na alocação. contagem
    vmstat.thp_split vazio O número de divisões de uma página enorme em páginas de base contagem
    vmstat.thp_zero_​page_alloc vazio O número de alocações bem-sucedidas de páginas zero enormes contagem
    vmstat.thp_zero_page_alloc_failed vazio O número de vezes em que o kernel falhou ao alocar uma página zero enorme e voltou a usar páginas pequenas. contagem
    vmstat.Balloon_inflate vazio
    vmstat.balão_​deflate vazio
    vmstat.balão_​migrate vazio
    os.linux.metrics-process-status proc.<process> .VmSize process-name A quantidade total de memória virtual usada pelo processo Base de conhecimento
    proc.<process> .VmRSS process-name A memória física não trocada que um processo usou Base de conhecimento
    proc.<process> .VmSwap process-name A quantidade total de espaço de troca usado. Base de conhecimento

    Verificações de monitoramento de rede do Linux

    Nota:
    Ao atualizar de uma versão anterior, adicione manualmente as verificações nesta tabela à política de métricas do Linux.
    Tabela 2. Política de métricas do Linux
    Tipo Verificação Descrição Uso e exemplo de uso Métricas coletadas Métrica em destaque
    Métrica os.linux.metrics-network-interface Recupera todas as métricas relacionadas à interface de rede para servidores Linux.
    Uso:
    • -x, excludeinterface: lista de interfaces a serem excluídas (separadas por vírgulas)
    • -i, includeinterface: lista de interfaces a serem incluídas (separadas por vírgulas)
    • -I, includeinterfaceregex: interfaces correspondentes de Regex a serem incluídas
    • -X, excludeinterfaceregex: interfaces correspondentes de Regex a serem excluídas

    Exemplo de uso: comando: métricas-network-interface.rb

    • rxBytes (métrica em destaque)
    • rxPackets (métrica em destaque)
    • rxErros
    • rxDrops (métrica em destaque)
    • rxFifo
    • rxFrame
    • rxCompressed
    • rxMulticast
    • rxBytes (métrica em destaque)
    • rxPackets (métrica em destaque)
    • rxErros
    • rxDrops (métrica em destaque)
    • rxFifo
    • rxColls
    • rxCarrier
    • rxCompressed
    sim
    Métrica os.linux.metrics-netstat-tcp Recupera métricas nos estados do soquete TCP do netstat. Útil em servidores proxy ou da Web de alto tráfego com um grande número de conexões TCP de curta duração entrando e saindo.
    Uso:
    • -p, port: a porta da qual você deseja receber métricas. Intervalo de valores = 1-65535.
    • -t, type: o tipo de porta da qual as métricas serão recebidas. Valores=local ou remoto. Padrão = local
    • -d, disabletcp6: desabilita a verificação de TCP6. Insira um valor para definir disabletcp6 = verdadeiro.

    Exemplo de uso: métricas-netstat-tcp.rb

    • tcp.DESCONHECIDO
    • tcp.ESTABELECIDO
    • tcp.SYN_SENT
    • tcp.SYN_RECV
    • tcp.FIN_WAIT1
    • tcp.FIN_WAIT2
    • tcp.TIME_WAIT
    • tcp.CLOSE
    • tcp.CLOSE_WAIT
    • tcp.LAST_ACK
    • tcp.Ouvir
    • tcp.FECHAMENTO
    não