Métricas Linux

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 11 min. de leitura
  • A tabela a seguir lista as métricas que são coletadas como saída de Linux verificações. Entradas indicadas como Métricas em destaque são métricas de alta visibilidade que são exibidas na guia Métrica Espaço do operador depois que um alerta é gerado. Essas métricas fornecem ao operador informações adicionais para ajudá-lo a explorar ainda mais o problema especificado.

    Tabela 1. métricas de os.linux.metrics-process-usage
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    proc.acc.em execução Número de processos em execução com este nome (acc).
    proc.acc.cpuPercent Porcentagem de CPU usada pelo processo.
    proc.acc.memPercentual Porcentagem de memória usada pelo processo.
    Tabela 2. Métricas de os.linux.metrics-reboot-count-today
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    reiniciar.contagem.hoje Número de reinicializações hoje.
    Tabela 3. métricas de os.linux.metrics-system-cpu
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    cpu.total.usuário Processos normais em execução no modo de usuário; cpu.total.user é o total das métricas cpuN.user.
    cpu.total.nice Processos do ANS em execução no modo de usuário; cpu.total.nice é o total das métricas cpuN.nice.
    cpu.total.sistema Tempo gasto pela CPU na execução do kernel; cpu.total.system é o total das métricas cpuN.system.
    cpu.total.idle Tempo total que a CPU gastou em um estado ocioso; cpu.total.idle é o total das métricas cpuN.idle.
    cpu.total.iowait Tempo total que a CPU gastou aguardando a conclusão das operações de E/S; cpu.total.iowait é o total das métricas cpuN.iowait.
    cpu.total.irq Total de tempo que o processador está gastando em interrupções; cpu.total.irq é o total das métricas cpuN.irq.
    cpu.total.softirq Tempo gasto no atendimento a solicitações de interrupção de software; cpu.total.softirq é o total das métricas cpuN.softirq.
    CPU.total.roubo Tempo total que a CPU virtual gastou aguardando o Hipervisor fazer a manutenção de outra CPU virtual. Aplica-se somente a máquinas virtuais.
    cpu.total.convidado Tempo total que a CPU gastou na execução do processador virtual. Aplica-se somente a Hipervisores.
    cpu.total.guest_nice Tempo total que a CPU gastou executando como um bom SO convidado; cpu.total.guset_nice é o total de cpuN.guest_nice métricas
    CPU.<cpu-core> .usuário Tempo gasto com processamento normal no modo de usuário.
    CPU.<cpu-core> .nice Tempo gasto com processamento agradável no modo de usuário.
    CPU.<cpu-core> .sistema Tempo gasto na execução no modo kernel.
    CPU.<cpu-core> .idle Tempo gasto ocioso.
    CPU.<cpu-core> .iowait Tempo gasto aguardando a conclusão de E/S. Também considerado tempo ocioso.
    CPU.<cpu-core> .irq Tempo gasto no atendimento a interrupções de hardware.
    CPU.<cpu-core> .softirq Tempo gasto no atendimento a interrupções de software.
    CPU.<cpu-core> .roubo Tempo roubado por outros sistemas operacionais em execução em um ambiente virtual.
    CPU.<cpu-core> .convidado Tempo gasto na execução de uma CPU virtual ou SO convidado sob o controle do kernel.
    CPU.<cpu-core> .guest_nice Tempo total que a CPU gastou na execução como um sistema operacional convidado.
    cpu.intr Interrupções atendidas desde a inicialização.
    cpu.ctxt Número total de comutadores de contexto em todas as CPUs.
    cpu.btime Hora de inicialização.
    cpu.processos O número de processos e threads criados, que inclui (mas não está limitado a) aqueles criados por chamadas para as chamadas do sistema fork() e clone().
    cpu.procs_running O número total de processos em execução em todas as CPUs.
    cpu.procs_blocked O número de processos atualmente bloqueados e aguardando a conclusão da E/S.
    cpu.cpu_count O número de CPUs no sistema.
    CPU.<cpu-core> .núcleos O número de núcleos de CPU.
    Tabela 4. métricas de os.linux.metrics-system-cpu-load
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    load_avg.one (métrica em destaque) A carga média do sistema em um minuto.
    load_avg.cinco (métrica em destaque) A carga média do sistema ao longo de cinco minutos.
    load_avg.fif11 (métrica em destaque) A carga média do sistema ao longo de quinze minutos.
    load_avg.norm.one A carga média do sistema em um minuto normalizada pelo número de CPUs.
    méd_carga.norm.cinco A carga média do sistema ao longo de cinco minutos normalizada pelo número de CPUs.
    méd_carga.norm.quinze A carga média do sistema ao longo de quinze minutos normalizada pelo número de CPUs.
    Tabela 5. métricas de os.linux.metrics-system-cpu-percentage
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    cpu.avgutilization_percentage A porcentagem média de CPU usada.
    cpu.user_percentage (métrica em destaque) Percentual de tempo total da CPU usada por processos normais no modo de usuário.
    cpu.nice_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs usadas por processos do bom estado no modo de usuário.
    cpu.system_percentage (métrica em destaque) Percentual de tempo gasto pela CPU na execução do kernel.
    cpu.idle_percentage (métrica em destaque) Percentual de tempo em que todos os CPIUs ficaram ociosos.
    cpu.iowait_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs aguardaram a conclusão da E/S.
    cpu.irq_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs atenderam interrupções.
    cpu.softirq_percentage (métrica em destaque) Percentual de tempo em que todos os CPIs atenderam às interrupções de software.
    cpu.steal_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs atenderam aos sistemas operacionais de host virtual.
    cpu.guest_percentage (métrica em destaque) Percentual de tempo em que todas as CPUs atenderam aos sistemas operacionais convidados.
    Tabela 6. métricas do os.linux.metrics-system-disk
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    disco.<disk-name> .reads (métrica em destaque) Número total de leituras concluídas com sucesso.
    disco.<disk-name> .readsMesclado Número total de leituras mescladas.
    disco.<disk-name> .sectorsRead Número total de setores lidos com sucesso.
    disco.<disk-name> .readTime milissegundos Número total de milissegundos gastos em todas as leituras.
    disco.<disk-name> .writes (métrica em destaque) Número total de gravações concluídas com sucesso.
    disco.<disk-name> .writesMesclado Número total de gravações mescladas.
    disco.<disk-name> .sectorsWritten Número total de setores gravados com sucesso.
    disco.<disk-name> .writeTime milissegundos Número total de milissegundos gastos em todas as gravações.
    disco.<disk-name> .ioInProgress Número total de E/Ss em andamento no momento.
    disco.<disk-name> .ioTime (métrica em destaque) Total de tempo gasto em E/Ss.
    disco.<disk-name> .ioTimeWeighted Total de tempo gasto em E/Ss. Isso pode fornecer uma medida do tempo de conclusão de E/S e do backlog que pode estar se acumulando.
    Tabela 7. métricas de os.linux.metrics-system-disk-capacity
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    disco.<file-system-name> .total O tamanho total do sistema de arquivos.
    disco.<file-system-name> .usado A quantidade total de espaço alocada para arquivos existentes no sistema de arquivos.
    disco.<file-system-name> .avail A quantidade total de espaço disponível no sistema de arquivos.
    disco.<file-system-name> .used_percentage A porcentagem do espaço disponível que está alocado atualmente para todos os arquivos no sistema de arquivos.
    disco.<file-system-name> .itotal O número total de inodes no sistema de arquivos.
    disco.<file-system-name> .iused O número de usados inodes.
    disco.<file-system-name> .iavail O número de inodeslivres (não utilizados).
    disco.<file-system-name> .iused_percentage A porcentagem de usado inodes.
    Tabela 8. métricas de os.linux.metrics-system-disk-usage
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    disk_usage.<disk> .total Quantidade total de espaço disponível no disco.
    disk_usage.<disk> .usado Quantidade total de espaço usado no disco.
    disk_usage.<disk> .avail Quantidade total de espaço disponível no disco.
    disk_usage.<disk> .used_percentage (métrica em destaque) A porcentagem de espaço usado no disco.
    Tabela 9. métricas de os.linux.metrics-system-memory
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    memória.total Total de RAM utilizável.
    memória.livre Total de RAM livre.
    memória.disponível Uma estimativa da quantidade de memória disponível para iniciar novas aplicações sem troca.
    memória. buffers Armazenamento temporário usado para blocos de disco brutos.
    memória.em cache Cache na memória para arquivos lidos do disco (o cache da página). Não inclui mem_swapcached.
    memory.swapTotal (métrica em destaque) Quantidade total de espaço de troca disponível.
    memory.swapFree (métrica em destaque) Quantidade de espaço de troca que não está sendo usada no momento.
    memória.dirty Memória que está aguardando a gravação no disco.
    memory.swapUsed (métrica em destaque) A quantidade de espaço de troca em uso.
    memória.usada A quantidade de RAM em uso.
    memória.usedWOBuffersCaches A quantidade de memória em uso.
    memória.freeWOBuffersCaches Valor de MemAvailable de /proc/meminfo se presente, mas retorna para memória livre + em buffer + em cache se não estiver.
    memory.swapUsedPercentage Percentual do espaço de troca usado.
    Tabela 10. métricas de os.linux.metrics-system-memory-percent
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    memory_percent.free (métrica em destaque) Percentual de RAM livre.
    memory_percent.available (métrica em destaque) Percentual de memória disponível
    memory_percent.buffers (métrica em destaque) Percentual de memória usada para blocos de disco brutos.
    memory_percent.cached (métrica em destaque) Percentual de memória usada com cache na memória para arquivos lidos do disco.
    memory_percent.dirty (métrica em destaque) Percentual de memória aguardando gravação de volta no disco.
    memory_percent.swapUsed (métrica em destaque) Percentual de espaço de troca usado.
    memory_percent.usedWOBuffersCaches (métrica em destaque) Percentual de memória usada.
    memory_percent.freeWOBuffersCaches (métrica em destaque) Percentual de memória disponível.
    Tabela 11. métricas de os.linux.metrics-system-uptime
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    system.uptime(s) A quantidade de tempo que o sistema está funcionando e disponível.
    Tabela 12. métricas de os.linux.metrics-memory-vmstat
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    vmstat.nr_free_pages Páginas que não estão sendo usadas pelo sistema no momento.
    vmstat.nr_alloc_batch Páginas alocadas a outros domínios devido à memória insuficiente em cada domínio de cada nó de acesso não uniforme à memória (NUMA).
    vmstat.nr_inactive_anon Páginas de memória em cada domínio de cada nó NUMA que não foram acessadas.
    vmstat.nr_active_anon Páginas de memória virtual anônimas que foram usadas recentemente.
    vmstat.nr_inactive_file A página de memória correspondente ao arquivo que não foi acessado em cada domínio de cada NUMA.
    vmstat.nr_active_file A página de memória correspondente ao arquivo que foi acessado recentemente.
    vmstat.nr_unevictable O número de páginas na lista de LRUs indespejáveis (não-).
    vmstat.nr_mlock Páginas mapeadas em um VMA VM_LOCKED que são uma classe de páginas que não podem ser removidas.
    vmstat.nr_anon_pages Páginas mapeadas na memória que não fazem parte de um arquivo.
    vmstat.nr_mapped O número de páginas mapeadas na memória.
    vmstat.nr_file_pages
    vmstat.nr_dirty Páginas aguardando gravação no disco.
    vmstat.nr_writeback Páginas que estão sendo gravadas em disco.
    vmstat.nr_slab_reclaimable Páginas do uso de memória do slab do kernel que podem ser recuperadas.
    vmstat.nr_slab_unreclaimable Páginas do uso de memória do slab do kernel que não podem ser recuperadas.
    vmstat.nr_page_table_pages Páginas alocadas para tabelas de páginas.
    vmstat.nr_kernel_stack Quantidade de memória alocada para pilhas de kernel.
    vmstat.nr_unstable O número de páginas instáveis em cada domínio de cada nó NUMA.
    vmstat.nr_bounce
    vmstat.nr_vmscan_write O número de páginas sujas gravadas durante uma verificação de LRUs.
    vmstat.nr_vmscan_immediate_reclaim
    vmstat.nr_writeback_temp
    vmstat.nr_ano_isolado O número de páginas de memória anônimas isoladas em cada domínio de cada nó NUMA.
    vmstat.nr_isolated_file O número de páginas de armazenamento de arquivo isoladas em cada domínio de cada nó NUMA.
    vmstat.nr_shmem O número de páginas de memória compartilhada.
    vmstat.nr_dirtied O número de páginas sujas em cada domínio de cada nó NUMA.
    vmstat.nr_escrito
    vmstat.numa_hit O número de páginas que foram alocadas com sucesso para este nó.
    vmstat.numa_miss O número de páginas que foram alocadas para este nó devido à pouca memória no nó pretendido.
    vmstat.numa_foreign O número de páginas inicialmente destinadas a este nó que foram alocadas a outro nó.
    vmstat.numa_interleave O número de páginas de política de intercalação alocadas com sucesso para este nó.
    vmstat.numa_local O número de páginas alocadas com sucesso neste nó por um processo neste nó.
    vmstat.numa_outro O número de páginas alocadas neste nó por um processo em outro nó.
    vmstat.workset_refault
    vmstat.workset_activate
    vmstat.workset_nodereclaim
    vmstat.nr_anon_transparent_hugepages
    vmstat.nr_free_cma Páginas do alocador de memória contínua livre em cada domínio de cada NUMA.
    vmstat.nr_dirty_threshold
    vmstat.nr_dirty_background_threshold
    vmstat.pgpgin O número de páginas trazidas do disco.
    vmstat.pgpgout O número de páginas gravadas no disco.
    vmstat.pswpin O número de páginas trazidas do espaço de troca.
    vmstat.pswpout O número de páginas trocadas no espaço de troca.
    vmstat.pgalloc_dma
    vmstat.pgalloc_dma32
    vmstat.pgalloc_normal
    vmstat.pgalloc_movable
    vmstat.pglivre O número de páginas livres desde a última inicialização.
    vmstat.pgativar Número de ativações de página desde a última inicialização.
    vmstat.pgdesativar Número de desativações de página desde a última inicialização.
    vmstat.pgfault Falhas secundárias desde a última inicialização.
    vmstat.pgmajfault Falhas graves desde a última inicialização.
    vmstat.pGLAZYFreed
    vmstat.pgrefill_dma
    vmstat.pgrefill_dma32
    vmstat.pgrefill_normal Número de reabastecimentos de página desde a última inicialização.
    vmstat.pgrefill_movable
    vmstat.pgsteal_kswapd_dma
    vmstat.pgsteal_kswapd_dma32
    vmstat.pgsteal_kswapd_normal
    vmstat.pgsteal_kswapd_movable
    vmstat.pgsteal_direct_dma
    vmstat.pgsteal_direct_dma32
    vmstat.pgsteal_direct_normal
    vmstat.pgsteal_direct_movable
    vmstat.pgscan_kswapd_dma
    vmstat.pgscan_kswapd_dma32
    vmstat.pgscan_kswapd_normal Número de páginas verificadas por kswapd desde a inicialização.
    vmstat.pgscan_kswapd_movable
    vmstat.pgscan_direct_dma
    vmstat.pgscan_direct_dma32
    vmstat.pgscan_direct_normal Número de páginas recuperadas desde a inicialização.
    vmstat.pgscan_direct_movable
    vmstat.pgscan_direct_throttle
    vmstat.zone_reclaim_failed
    vmstat.pginodesteal
    vmstat.slabs_scanned
    vmstat.kswapd_inodesteal
    vmstat.kswapd_low_wmark_hit_quickly
    vmstat.kswapd_high_wmark_hit_quickly
    vmstat.pageoutrun Número de vezes que kswapd chamou a recuperação de página.
    vmstat.allocstall Número de vezes que a recuperação de página foi chamada diretamente (memória insuficiente).
    vmstat.pgrotated
    vmstat.drop_pagecache
    vmstat.drop_slab
    vmstat.numa_pte_updates
    vmstat.numa_huge_pte_updates
    vmstat.numa_hint_faults
    vmstat.numa_hint_faults_local
    vmstat.numa_pages_migated
    vmstat.pgmigrate_success
    vmstat.pgmigrate_fail
    vmstat.compact_migrate_scanned
    vmstat.compact_free_scanned
    vmstat.compact_Isolated
    vmstat.compact_stall O número de vezes que um processo para ao executar a compactação de memória para que uma página enorme fique livre para uso.
    vmstat.compact_fail O número de vezes que o sistema tentou compactar a memória, mas falhou.
    vmstat.compact_success O número de vezes que o sistema compactou a memória e liberou uma página enorme para uso.
    vmstat.htlb_buddy_alloc_success
    vmstat.htlb_buddy_alloc_fail
    vmstat.unevictable_pgs_culled
    vmstat.unevictable_pgs_scanned
    vmstat.unevictable_pgs_rescued
    vmstat.unevictable_pgs_mlocked
    vmstat.unevictable_pgs_munlocked
    vmstat.unevictable_pgs_cleared
    vmstat.unevictable_pgs_stranded
    vmstat.thp_fault_alloc O número de páginas enormes alocadas com sucesso para lidar com uma falha de página.
    vmstat.thp_fault_fallback O número de falhas de página falha ao alocar uma página enorme antes de voltar a usar páginas pequenas.
    vmstat.thp_collapse_alloc O número de páginas recolhidas em uma página enorme com a alocação bem-sucedida de uma nova página enorme para armazenar os dados.
    vmstat.thp_collapse_alloc_failed O número de páginas foi recolhido em uma página enorme, mas houve falha na alocação.
    vmstat.thp_split O número de páginas base a serem divididas de uma página enorme.
    vmstat.thp_zero_page_alloc O número de alocações bem-sucedidas de páginas zero grandes.
    vmstat.thp_zero_page_alloc_failed O número de vezes que o kernel falhou ao alocar uma página zero enorme e voltou a usar páginas pequenas.
    vmstat.balão_inflate
    vmstat.balão_deflacionar
    vmstat.balão_migrar
    Tabela 13. métricas do os.linux.metrics-process-status
    Tipo de métrica Recurso (nome do banco de dados específico, quando relevante) Unidades Descrição do tipo de métrica
    proc.<process> .VmSize A quantidade total de memória virtual usada pelo processo.
    proc.<process> .VmRSS A memória física não trocada usada por um processo.
    proc.<process> .VmSwap A quantidade total de espaço de troca usado.