Métricas Linux

  • Versão de lançamento: Xanadu
  • Atualizado 1 de ago. de 2024
  • 11 min. de leitura
  • A tabela a seguir lista as métricas que são coletadas como saída de Linux verificações. Entradas indicadas como Métricas em destaque são métricas de alta visibilidade exibidas na guia Métrica Espaço do operador depois que um alerta é gerado. Essas métricas fornecem ao operador informações adicionais para ajudá-lo a explorar melhor o problema especificado.

    Tabela 1. métricas os.linux.metrics-process-usage
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    proc.acc.em execução Número de processos em execução com este nome (acc).
    proc.acc.cpuPercent Porcentagem de CPU utilizada pelo processo.
    proc.acc.memPercent Porcentagem de memória usada pelo processo.
    Tabela 2. Métricas os.linux.metrics-reboot-count-today
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    reboot.count.today Número de reinicializações hoje.
    Tabela 3. métricas os.linux.metrics-system-cpu
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    cpu.total.usuário Processos normais em execução no modo de usuário; cpu.total.user é o total das cpuN.user métricas.
    cpu.total.nice Processos do NICE em execução no modo de usuário; cpu.total.nice é o total das cpuN.nice métricas.
    cpu.total.sistema Tempo gasto pela CPU na execução do kernel; cpu.total.system é o total das cpuN.system métricas.
    cpu.total.idle Tempo total que a CPU gastou em um estado ocioso; cpu.total.idle é o total das cpuN.idle métricas.
    cpu.total.iowait Tempo total que a CPU gastou aguardando a conclusão das operações de E/S; cpu.total.iowait é o total das cpuN.iowait métricas.
    cpu.total.irq Tempo total que o processador está gastando em Interrupções; cpu.total.irq é o total das cpuN.irq métricas.
    cpu.total.softirq Tempo gasto no atendimento de solicitações de interrupção flexível; cpu.total.softirq é o total das cpuN.softirq métricas.
    cpu.total.roubo Tempo total que a CPU virtual gastou aguardando o Hipervisor atender a outra CPU virtual. Aplica-se somente a máquinas virtuais.
    cpu.total.convidado Tempo total que a CPU gastou executando o processador virtual. Aplica-se somente a Hipervisores.
    cpu.total.convidado_nice Tempo total que a CPU gastou em execução como um bom SO convidado; cpu.total.guset_nice é o total das cpuN.guest_nice métricas
    cpu.<cpu-core> .usuário Tempo gasto com processamento normal no modo de usuário.
    cpu.<cpu-core> .agradável Tempo gasto com o processamento de redefinição no modo de usuário.
    cpu.<cpu-core> .sistema Tempo gasto na execução no modo kernel.
    cpu.<cpu-core> .ocioso Tempo gasto ocioso.
    cpu.<cpu-core> .iowait Tempo gasto aguardando a conclusão de E/S. Também considerado tempo ocioso.
    cpu.<cpu-core> .irq Tempo gasto no atendimento a interrupções de hardware.
    cpu.<cpu-core> .softirq Tempo gasto no atendimento a interrupções de software.
    cpu.<cpu-core> .roubo Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual.
    cpu.<cpu-core> .convidado Tempo gasto na execução de uma CPU virtual ou SO convidado sob o controle do kernel.
    cpu.<cpu-core> .convidado_nice Tempo total que a CPU gastou executando como SO convidado.
    cpu.intr Interrupções atendidas desde o momento da inicialização.
    cpu.ctxt Número total de comutadores de contexto em todas as CPUs.
    cpu.btime Tempo de inicialização.
    cpu.processos O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas de sistema fork() e clone().
    cpu.procs_running O número total de processos em execução em todas as CPUs.
    cpu.procs_blocked O número de processos bloqueados no momento e aguardando a conclusão da E/S.
    cpu.cpu_count O número de CPUs no sistema.
    cpu.<cpu-core> .cores O número de núcleos de CPU.
    Tabela 4. métricas os.linux.metrics-system-cpu-load
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    load_avg.one (métrica em destaque) A carga média do sistema em um minuto.
    load_avg.cinco (métrica em destaque) A carga média do sistema em cinco minutos.
    load_avg.fif11 (métrica em destaque) A carga média do sistema em quinze minutos.
    load_avg.norm.one A carga média do sistema em um minuto normalizada pelo número de CPUs.
    load_avg.norm.cinco A carga média do sistema ao longo de cinco minutos normalizada pelo número de CPUs.
    load_avg.norm.quinze A carga média do sistema ao longo de quinze minutos normalizada pelo número de CPUs.
    Tabela 5. métricas os.linux.metrics-system-cpu-percentage
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    cpu.avgutilization_percentage A porcentagem média de CPU usada.
    cpu.user_percentage (métrica em destaque) Percentual de tempo total em que a CPU foi usada por processos normais no modo de usuário.
    cpu.nice_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs são usadas por processos de redefinição no modo de usuário.
    cpu.system_percentage (métrica em destaque) Percentual de tempo gasto pela CPU na execução do kernel.
    cpu.idle_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs ficaram ociosas.
    cpu.iowait_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs aguardaram a conclusão da E/S.
    cpu.irq_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs atenderam interrupções.
    cpu.softirq_percentage (métrica em destaque) Percentual de tempo em que todos os CPIs atenderam interrupções de software.
    cpu.steal_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs atenderam a sistemas operacionais de host virtual.
    cpu.guest_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs atenderam a sistemas operacionais convidados.
    Tabela 6. métricas os.linux.metrics-system-disk
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    disco.<disk-name> .reads (métrica em destaque) Número total de leituras concluídas com sucesso.
    disco.<disk-name> .readsMerged Número total de leituras mescladas.
    disco.<disk-name> .sectorsLeitura Número total de setores lidos com sucesso.
    disco.<disk-name> .readTime milissegundos Número total de milissegundos gastos por todas as leituras.
    disco.<disk-name> .writes (métrica em destaque) Número total de gravações concluídas com sucesso.
    disco.<disk-name> .writesMerged Número total de gravações mescladas.
    disco.<disk-name> .setoresGravados Número total de setores gravados com sucesso.
    disco.<disk-name> .writeTime milissegundos Número total de milissegundos gastos por todas as gravações.
    disco.<disk-name> .ioInProgress Número total de E/Ss em andamento.
    disco.<disk-name> .ioTime (métrica em destaque) Tempo total gasto em E/S.
    disco.<disk-name> .ioTimeWeighted Tempo total gasto em E/S. Isso pode fornecer uma medida do tempo de conclusão de E/S e do backlog que pode estar se acumulando.
    Tabela 7. métricas de os.linux.metrics-system-disk-capacity
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    disco.<file-system-name> .total O tamanho total do sistema de arquivos.
    disco.<file-system-name> .usado A quantidade total de espaço alocado para arquivos existentes no sistema de arquivos.
    disco.<file-system-name> .disponível A quantidade total de espaço disponível no sistema de arquivos.
    disco.<file-system-name> .used_percentage A porcentagem do espaço disponível que está alocada atualmente para todos os arquivos no sistema de arquivos.
    disco.<file-system-name> .itotal O número total de inodes no sistema de arquivos.
    disco.<file-system-name> .usado O número de usados inodes.
    disco.<file-system-name> .ivail O número de inodes.
    disco.<file-system-name> .used_percentage A porcentagem de usados inodes.
    Tabela 8. métricas os.linux.metrics-system-disk-usage
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    disk_usage.<disk> .total Quantidade total de espaço disponível no disco.
    disk_usage.<disk> .usado Quantidade total de espaço usado no disco.
    disk_usage.<disk> .disponível Quantidade total de espaço disponível no disco.
    disk_usage.<disk> .used_percentage (métrica em destaque) A porcentagem de espaço usada no disco.
    Tabela 9. métricas os.linux.metrics-system-memory
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    memória.total Total de RAM utilizável.
    memória.livre Total de RAM livre.
    memória.disponível Uma estimativa da quantidade de memória disponível para iniciar novas aplicações sem troca.
    memória. buffers Armazenamento temporário usado para blocos de disco bruto.
    memória.cache Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached.
    memory.swapTotal (métrica em destaque) Quantidade total de espaço de troca disponível.
    memory.swapFree (métrica em destaque) Quantidade de espaço de troca que não está sendo usada no momento.
    memória.suja Memória que está aguardando para ser gravada de volta no disco.
    memory.swapUsed (métrica em destaque) A quantidade de espaço de troca em uso.
    memória.usada A quantidade de RAM em uso.
    memory.usedWOBuffersCaches A quantidade de memória em uso.
    memory.freeWOBuffersCaches Valor de MemAvailable de /proc/meminfo se estiver presente, mas retornará para a memória livre + em buffer + em cache se não estiver.
    memory.swapUsedPercentage Percentual de espaço de troca usado.
    Tabela 10. métricas os.linux.metrics-system-memory-percent
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    memory_percent.free (métrica em destaque) Percentual de RAM livre.
    memory_percent.available (métrica em destaque) Percentual de memória disponível
    memory_percent. buffers (métrica em destaque) Porcentagem de memória usada para blocos de disco brutos.
    memory_percent.cached (métrica em destaque) Percentual de memória usada com cache na memória para arquivos lidos do disco.
    memory_percent.dirty (métrica em destaque) Percentual de memória aguardando para ser gravado de volta no disco.
    memory_percent.swapUsed (métrica em destaque) Percentual de espaço de troca usado.
    memory_percent.usedWOBuffersCaches (métrica em destaque) Porcentagem de memória usada.
    memory_percent.freeWOBuffersCaches (métrica em destaque) Percentual de memória disponível.
    Tabela 11. métricas os.linux.metrics-system-uptime
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    system.uptime(s) A quantidade de tempo em que o sistema está funcionando e disponível.
    Tabela 12. métricas os.linux.metrics-memory-vmstat
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    vmstat.nr_free_pages Páginas que não estão sendo usadas pelo sistema no momento.
    vmstat.nr_alloc_batch Páginas alocadas a outros domínios devido à memória insuficiente em cada domínio de cada nó de acesso não uniforme à memória (NUMA).
    vmstat.nr_inactive_anon Páginas de memória em cada domínio de cada nó NUMA que não foram acessados.
    vmstat.nr_active_anon Páginas de memória virtual anônima que foram usadas recentemente.
    vmstat.nr_inactive_file A página de memória correspondente ao arquivo que não foi acessado em cada domínio de cada NUMA.
    vmstat.nr_active_file A página de memória correspondente ao arquivo que foi acessado recentemente.
    vmstat.nr_unevictable O número de páginas na lista de LRUs indespejáveis (não-).
    vmstat.nr_mlock Páginas mapeadas em um VMA VM_LOCKED que são uma classe de páginas indesejáveis.
    vmstat.nr_anon_pages Páginas mapeadas na memória que não fazem parte de um arquivo.
    vmstat.nr_mapped O número de páginas mapeadas de memória.
    vmstat.nr_file_pages
    vmstat.nr_dirty Páginas aguardando para serem gravadas no disco.
    vmstat.nr_writeback Páginas que estão sendo gravadas no disco.
    vmstat.nr_slab_reclaimable Páginas do uso de memória de slab do kernel que podem ser recuperadas.
    vmstat.nr_slab_unreclaimable Páginas do uso de memória de slab do kernel que não podem ser recuperadas.
    vmstat.nr_page_table_pages Páginas alocadas para tabelas de páginas.
    vmstat.nr_kernel_stack Quantidade de memória alocada para pilhas de kernel.
    vmstat.nr_unstable O número de páginas instáveis em cada domínio de cada nó NUMA.
    vmstat.nr_bounce
    vmstat.nr_vmscan_write O número de páginas modificadas gravadas durante uma verificação de LRUs.
    vmstat.nr_vmscan_immediate_reclaim
    vmstat.nr_writeback_temp
    vmstat.nr_isolated_anon O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA.
    vmstat.nr_isolated_file O número de páginas de armazenamento de arquivo isoladas em cada domínio de cada nó NUMA.
    vmstat.nr_shmem O número de páginas de memória compartilhada.
    vmstat.nr_dirtied O número de páginas sujas em cada domínio de cada nó NUMA.
    vmstat.nr_escrito
    vmstat.numa_hit O número de páginas que foram alocadas com sucesso para este nó.
    vmstat.numa_miss O número de páginas que foram alocadas para este nó devido à pouca memória no nó pretendido.
    vmstat.numa_foreign O número de páginas destinadas inicialmente a este nó que foram alocadas a outro nó.
    vmstat.numa_interleave O número de páginas de política intercaladas alocadas com sucesso para este nó.
    vmstat.numa_local O número de páginas alocadas com sucesso neste nó por um processo neste nó.
    vmstat.numa_outros O número de páginas alocadas neste nó por um processo em outro nó.
    vmstat.workset_refault
    vmstat.workset_activate
    vmstat.workset_nodereclaim
    vmstat.nr_anon_transparent_hugepages
    vmstat.nr_free_cma Páginas do alocador de memória contínua livre em cada domínio de cada NUMA.
    vmstat.nr_dirty_threshold
    vmstat.nr_dirty_background_threshold
    vmstat.pgpgin O número de páginas trazidas do disco.
    vmstat.pgpgout O número de páginas gravadas no disco.
    vmstat.pswpin O número de páginas trazidas do espaço de troca.
    vmstat.pswpout O número de páginas trocadas no espaço de troca.
    vmstat.pgalloc_dma
    vmstat.pgalloc_dma32
    vmstat.pgalloc_normal
    vmstat.pgalloc_movable
    vmstat.pglivre O número de páginas livres desde a última inicialização.
    vmstat.pgativar Número de ativações de página desde a última inicialização.
    vmstat.pgdesativar Número de desativações de página desde a última inicialização.
    vmstat.pgfault Falhas secundárias desde a última inicialização.
    vmstat.pgmajfault Falhas graves desde a última inicialização.
    vmstat.pglazyfreed
    vmstat.pgrefill_dma
    vmstat.pgrefill_dma32
    vmstat.pgrefill_normal Número de reabastecimentos de página desde a última inicialização.
    vmstat.pgrefill_movable
    vmstat.pgsteal_kswapd_dma
    vmstat.pgsteal_kswapd_dma32
    vmstat.pgsteal_kswapd_normal
    vmstat.pgsteal_kswapd_movable
    vmstat.pgsteal_direct_dma
    vmstat.pgsteal_direct_dma32
    vmstat.pgsteal_direct_normal
    vmstat.pgsteal_direct_movable
    vmstat.pgscan_kswapd_dma
    vmstat.pgscan_kswapd_dma32
    vmstat.pgscan_kswapd_normal Número de páginas verificadas por kswapd desde a inicialização.
    vmstat.pgscan_kswapd_movable
    vmstat.pgscan_direct_dma
    vmstat.pgscan_direct_dma32
    vmstat.pgscan_direct_normal Número de páginas recuperadas desde a inicialização.
    vmstat.pgscan_direct_movable
    vmstat.pgscan_direct_throttle
    vmstat.zone_reclaim_failed
    vmstat.pginodesteal
    vmstat.slabs_scanned
    vmstat.kswapd_inodesteal
    vmstat.kswapd_low_wmark_hit_quickly
    vmstat.kswapd_high_wmark_hit_quickly
    vmstat.pageoutrun Número de vezes que kswapd acionou a recuperação de página.
    vmstat.allocstall Número de vezes que a recuperação de página foi chamada diretamente (memória baixa).
    vmstat.pgrotated
    vmstat.drop_pagecache
    vmstat.drop_slab
    vmstat.numa_pte_updates
    vmstat.numa_huge_pte_updates
    vmstat.numa_hint_faults
    vmstat.numa_hint_faults_local
    vmstat.numa_pages_migated
    vmstat.pgmigrate_success
    vmstat.pgmigrate_fail
    vmstat.compact_migrate_scanned
    vmstat.compact_free_scanned
    vmstat.compact_isolated
    vmstat.compact_stall O número de vezes que um processo trava ao executar a compactação de memória para que uma página enorme fique livre para uso.
    vmstat.compact_fail O número de vezes que o sistema tentou compactar a memória, mas falhou.
    vmstat.compact_success O número de vezes que o sistema compactou a memória e liberou uma página enorme para uso.
    vmstat.htlb_buddy_alloc_success
    vmstat.htlb_buddy_alloc_fail
    vmstat.unevictable_pgs_culled
    vmstat.unevictable_pgs_scanned
    vmstat.unevictable_pgs_rescued
    vmstat.unevictable_pgs_mlocked
    vmstat.unevictable_pgs_munlocked
    vmstat.unevictable_pgs_cleared
    vmstat.unevictable_pgs_straded
    vmstat.thp_fault_alloc O número de páginas enormes alocadas com sucesso para lidar com uma falha de página.
    vmstat.thp_fault_fallback O número de falhas de página falha ao alocar uma página enorme antes de voltar a usar páginas pequenas.
    vmstat.thp_collapse_alloc O número de páginas foi recolhido em uma página enorme com a alocação bem-sucedida de uma nova página enorme para armazenar os dados.
    vmstat.thp_collapse_alloc_failed O número de páginas foi recolhido em uma página enorme, mas houve falha na alocação.
    vmstat.thp_split O número de páginas base a serem separadas de uma página enorme.
    vmstat.thp_zero_page_alloc O número de alocações bem-sucedidas de páginas zero enormes.
    vmstat.thp_zero_page_alloc_failed O número de vezes em que o kernel falhou ao alocar uma página zero enorme e voltou a usar páginas pequenas.
    vmstat.Balloon_inflate
    vmstat.balão_deflate
    vmstat.balão_migrar
    Tabela 13. métricas os.linux.metrics-process-status
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    proc.<process> .VmSize A quantidade total de memória virtual usada pelo processo.
    proc.<process> .VmRSS A memória física não trocada usada por um processo.
    proc.<process> .VmSwap A quantidade total de espaço de troca usado.