Vérifications et politiques par défaut de Linux

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 12 minutes de lecture
  • Agent Client Collector assure les vérifications et politiques par défaut suivantes pour Linux la surveillance des mesures.

    Vérifications des mesures de surveillance Linux

    Tableau 1. Politique de mesures Linux
    Vérifier Nom de la mesure Ressource Description Unités Mesure proposée Détection d'anomalie
    os.linux.metrics-process-usage proc.acc.running nom_processus Nombre de processus en cours d’exécution avec ce nom (acc) compter
    proc.acc.cpuPercent nom_processus Pourcentage du processeur pris par le processus. pourcentage

    proc.acc.memPercent

    nom_processus Pourcentage de mémoire prise par le processus. pourcentage
    os.linux.metrics-reboot-count-today reboot.count.today vide Nombre de redémarrages effectués aujourd’hui compter
    os.linux.metrics-system-cpu cpu.total.user total Processus normaux s’exécutant en mode utilisateur ; cpu.total.user est le total des mesures cpuN.user. compter
    cpu.total.nice total Processus niced s’exécutant en mode utilisateur ; cpu.total.nice est le total des mesures cpuN.nice. compter
    cpu.total.system total Temps passé par le processeur à exécuter le noyau ; cpu.total.system est le total des mesures cpuN.system. seconde
    cpu.total.idle total Temps total que le processeur a passé dans un état d’inactivité. cpu.total.idle est le total des mesures cpuN.idle. seconde
    cpu.total.iowait total Temps total que le processeur a passé à attendre la fin des opérations d’E/S ; cpu.total.iowait est le total des mesures cpuN.iowait. seconde
    cpu.total.irq total Temps total que le processeur consacre à la gestion des interruptions ; cpu.total.irq est le total des mesures cpuN.irq. seconde
    cpu.total.softirq total Temps consacré au traitement des demandes d’interruption logicielle ; cpu.total.softirq est le total des mesures cpuN.softirq. seconde
    cpu.total.steal total Temps total que le processeur virtuel a passé à attendre que l’hyperviseur dessert un autre processeur virtuel. S’applique uniquement aux ordinateurs virtuels. seconde
    cpu.total.guest total Temps total passé par le processeur à exécuter le processeur virtuel. S’applique uniquement aux hyperviseurs. seconde
    cpu.total.guest_nice total Temps total que le processeur a passé à s’exécuter en tant que système d’exploitation invité agréable. cpu.total.guset_nice si le total des mesures de cpuN.guest_nice seconde
    cpu.<cpu-core>.user cpu-core Temps passé avec un traitement normal en mode utilisateur. seconde
    cpu.<cpu-core>.nice cpu-core Temps passé avec des processus agréables en mode utilisateur. seconde
    cpu.<cpu-core>.system cpu-core Temps passé à s'exécuter en mode noyau. seconde
    cpu.<cpu-core>.idle cpu-core Temps passé en vacances à se tourner les pouces. seconde
    cpu.<cpu-core>.iowait cpu-core Temps passé à attendre la fin des E/S. C’est aussi considéré comme du temps d’inactivité. seconde
    cpu.<cpu-core>.irq cpu-core Temps passé à servir des interruptions matérielles. seconde
    cpu.<cpu-core>.softirq cpu-core Temps passé à servir des interruptions logicielles. seconde
    cpu.<cpu-core>.steal cpu-core Temps volé par d'autres systèmes d'exploitation exécutés dans un environnement virtuel. seconde
    cpu.<cpu-core>.guest cpu-core Temps passé à exécuter un processeur virtuel ou un système d’exploitation invité sous le contrôle du noyau. seconde
    cpu.<cpu-core>.guest_nice cpu-core Temps total passé par le processeur à exécuter en tant que système d'exploitation invité opérationnel. seconde
    cpu.intr vide Interruptions de service depuis l'heure de démarrage. seconde
    cpu.ctxt vide Nombre total de commutateurs de contexte entre tous les processeurs. compter
    cpu.btime vide Heure à laquelle le système a démarré seconde
    cpu.processes vide Nombre de processus et de threads créés, qui incluent (sans toutefois s'y limiter) ceux créés par les appels système fork() et clone(). compter
    cpu.procs_running vide Nombre total de processus en cours d'exécution sur tous les processeurs. compter
    cpu.procs_blocked vide Nombre de processus actuellement bloqués en attente de la fin des E/S. compter
    cpu.cpu_count vide Nombre de processeurs sur le système compter
    cpu.<cpu-core>.cores cpu-core Nombre de cœurs de processeur Nombre de cœurs
    os.linux.metrics-system-cpu-load load_avg.un vide Charge moyenne du système sur une minute. Nombre de threads yes yes
    load_avg,cinq vide Charge moyenne du système sur cinq minutes. Nombre de threads yes yes
    load_avg,quinze vide Charge moyenne du système sur quinze minutes. Nombre de threads yes yes
    load_avg.norm.one vide Charge moyenne du système sur une minute normalisée par le nombre de processeurs. Nombre de threads
    load_avg.norm.five vide Charge moyenne du système sur cinq minutes normalisée par le nombre de processeurs. Nombre de threads
    load_avg.norm.fifteen vide Charge moyenne du système sur quinze minutes normalisée par le nombre de processeurs. Nombre de threads
    os.linux.metrics-system-cpu-percentage cpu.avgutilization_percentage vide Pourcentage du processeur utilisé en moyenne pourcentage
    cpu.user_percentage vide Pourcentage du temps pendant lequel le processeur total a été utilisé par les processus normaux en mode utilisateur pourcentage yes yes
    cpu.nice_percentage vide Pourcentage de temps tous les processeurs utilisés par les processus niced en mode utilisateur pourcentage yes yes

    cpu.system_percentage

    vide Pourcentage du temps que le processeur a passé à exécuter le noyau. pourcentage yes yes
    cpu.idle_percentage vide Pourcentage du temps pendant lequel tous les processeurs ont été inactifs pourcentage yes yes

    cpu.iowait_percentage

    vide Pourcentage du temps pendant lequel tous les processeurs attendent la fin des E/S pourcentage yes yes
    cpu.irq_percentage vide Pourcentage du temps toutes les interruptions de service des processeurs pourcentage yes yes

    cpu.softirq_percentage

    vide Pourcentage du temps pendant lequel tous les processeurs entretiennent des interruptions logicielles pourcentage yes yes
    cpu.steal_percentage vide Pourcentage du temps où tous les processeurs sont desservis Hôtes virtuels Systèmes d’exploitation pourcentage yes yes
    cpu.guest_percentage vide Pourcentage du temps pendant lequel tous les processeurs sont traités Système d’exploitation invité pourcentage yes yes
    os.linux.metrics-system-disk disque.<nom_disque>.reads nom_disque Nombre total de lectures correctement terminées. compter yes yes
    disk.<nom-disque>.readsMerged nom_disque Nombre total de lectures fusionnées compter
    disk.<nom-disque>.sectorsRead nom_disque Nombre total de secteurs correctement lus. compter
    disk.<nom-disque>.readTime nom_disque Nombre total de millisecondes passées sur toutes les lectures. millisec
    disque.<nom_disque>.écritures nom_disque Nombre total d'écritures correctement terminées. compter yes yes
    disk.<nom-disque>.writesMerged nom_disque Nombre total d’écritures fusionnées compter
    disk.<nom-disque>.sectorsWritten nom_disque Nombre total de secteurs correctement écrits. compter
    disk.<nom-disque>.writeTime nom_disque Nombre total de millisecondes passées sur toutes les écritures. Misllisec
    disk.<nom-disque>.ioInProgress nom_disque Nombre total d’E/S actuellement en cours compter
    disk.<nom-disque>.ioTime Temps total passé à effectuer des E/S millisec yes yes
    disk.<nom-disque>.ioTimeWeighted nom_disque Temps total consacré aux E/S. Cela peut fournir une mesure facile du temps d’exécution des E/S et du backlog qui peut s’accumuler. millisec
    os.linux.metrics-system-disk-capacity disk.<file-system-name>.total nom du système de fichiers Taille totale du système de fichiers. octet
    disk.<file-system-name>.used nom du système de fichiers Quantité totale d'espace alloué aux fichiers existants dans le système de fichiers. octet
    disk.<file-system-name>.avail nom du système de fichiers Quantité totale d'espace disponible dans le système de fichiers. octet
    disk.<file-system-name>.used_percentage nom du système de fichiers Pourcentage de l’espace disponible actuellement alloué à tous les fichiers du système de fichiers. pourcentage
    disk.<file-system-name>.itotal nom du système de fichiers Nombre total d’inodes sur le système de fichiers. compter
    disk.<file-system-name>.iused nom du système de fichiers Nombre d’inodes utilisés. compter
    disk.<file-system-name>.iavail nom du système de fichiers Nombre d’inodes libres (inutilisés). compter
    disk.<file-system-name>.iused_percentage nom du système de fichiers Pourcentage d’inodes utilisés. pourcentage
    os.linux.metrics-system-disk-usage disk_usage.<disque>.total nom_disque Quantité totale d’espace disponible sur ce disque octets
    disk_usage.<disque>.used nom_disque Quantité totale d’espace utilisé sur ce disque octets
    disk_usage.<disque>.avail nom_disque Quantité totale d’espace disponible sur ce disque octets
    disk_usage.<disk>.used_percentage nom_disque Pourcentage d’espace utilisé sur ce disque pourcentage yes yes
    os.linux.metrics-system-memoryos.linux.metrics-system-memory-percent memory.total vide Mémoire RAM utilisable totale. BC
    memory.free vide Mémoire RAM gratuite totale. BC
    memory.available vide Estimation de la quantité de mémoire disponible pour démarrer de nouvelles applications, sans échanger. BC
    memory.buffers vide Stockage temporaire utilisé pour les blocs de disque bruts. BC
    memory.cached vide Cache en mémoire pour les fichiers lus à partir du disque (cache de la page). N’inclut pas mem_swapcached. BC
    mémoire.swapTotal vide Quantité totale d'espace d'échange disponible. BC yes yes
    mémoire.swapFree vide Quantité d'espace d'échange actuellement inutilisé. yes yes
    memory.dirty vide Mémoire qui attend d’être réécrite sur le disque. BC
    memory.swapUsed vide Quantité d'espace d'échange en cours d'utilisation. BC yes yes
    memory.used vide Quantité de mémoire RAM utilisée. BC
    mémoire.usedWOBuffersCaches vide Quantité de mémoire utilisée. BC
    mémoire.freeWOBuffersCaches vide Valeur de MemAvailable from /proc/meminfo si elle est présente, mais revient à l’ajout de mémoire libre + tamponnée + mise en cache si ce n’est pas le cas. BC
    mémoire.swapUsedPercentage vide Pourcentage d'espace d'échange utilisé. pourcentage
    memory_percent.libre vide Pourcentage de RAM libre pourcentage yes yes
    memory_percent.disponible vide Pourcentage de Mem disponible pourcentage yes yes
    memory_percent.Tampons vide Récent de la mémoire utilisée pour les blocs de disque bruts pourcentage yes yes
    memory_percent.Cache vide Pourcentage de mémoire utilisé pour le cache en mémoire des fichiers lus à partir du disque pourcentage yes yes
    memory_percent.sale vide Pourcentage de mémoire en attente d’être réécrite sur le disque. pourcentage yes yes
    memory_percent.swapUsed vide Pourcentage d'espace d'échange utilisé. pourcentage yes yes
    memory_percent.usedWOBuffersCaches vide Pourcentage de la mémoire utilisée pourcentage yes yes
    memory_percent.freeWOBuffersCaches vide Pourcentage de mémoire disponible pourcentage yes yes
    os.linux.metrics-system-uptime system.uptime(sec) vide Durée d'activité et de disponibilité du système. seconde
    os.linux.metrics-memory-vmstat vmstat.nr_free_pages vide Pages actuellement inutilisées par le système. pages
    vmstat.nr_alloc_batch vide pages allouées à d’autres domaines en raison d’une mémoire insuffisante dans chaque domaine de chaque NUMA pages
    vmstat.nr_inactive_anon vide pages mémoire dans chaque domaine de chaque nœud NUMA qui n’ont pas été consultées depuis longtemps pages
    vmstat.nr_active_anon vide Pages de mémoire virtuelle anonymes récemment utilisées BC
    vmstat.nr_inactive_file vide La page mémoire correspondant au fichier qui n’a pas été consulté depuis longtemps dans chaque domaine de chaque NUMA. BC
    vmstat.nr_active_file vide La page de mémoire correspondant au fichier qui a fait l’objet d’un accès récemment. pages
    vmstat.nr_unevictable vide Nombre de pages dans la liste des (non-)LRU non exvinçables compter
    vmstat.nr_mlock vide Les pages mappées dans un VMA VM_LOCKED - sont une classe de pages irrécupérables. pages
    vmstat.nr_anon_pages vide Pages mappées en mémoire qui ne font pas partie d’un fichier. pages
    vmstat.nr_mapped vide Nombre de pages mappées de mémoire. compter
    vmstat.nr_file_pages vide
    vmstat.nr_dirty vide Pages en attente d’écriture sur le disque pages
    vmstat.nr_writeback vide Pages en cours d’écriture sur le disque pages
    vmstat.nr_slab_reclaimable vide Pages de l’utilisation de la mémoire de la dalle de noyau qui peuvent être récupérées pages
    vmstat.nr_slab_unreclaimable vide Pages de l’utilisation de la mémoire de la dalle de noyau qui ne peuvent pas être récupérées pages
    vmstat.nr_page_table_pages vide Pages allouées aux tables de pages pages
    vmstat.nr_kernel_stack vide Quantité de mémoire allouée aux piles de noyau. BC
    vmstat.nr_unstable vide Nombre de pages instables dans chaque domaine de chaque nœud NUMA compter
    vmstat.nr_bounce vide
    vmstat.nr_vmscan_write vide Nombre de pages erronées réécrites lors d’une analyse de LRU (s) compter
    vmstat.nr_vmscan_immediate_reclaim vide
    vmstat.nr_writeback_temp vide
    vmstat.nr_isolated_anon vide Nombre de pages mémoire anonymes isolées dans chaque domaine de chaque nœud NUMA compter
    vmstat.nr_isolated_file vide Le nombre de pages de stockage de fichiers isolées dans chaque domaine de chaque nœud NUMA compter
    vmstat.nr_shmem vide Le nombre de pages de mémoire partagée compter
    vmstat.nr_dirtied vide Nombre de pages erronées dans chaque domaine de chaque nœud NUMA compter
    vmstat.nr_written vide
    vmstat.numa_hit vide Nombre de pages qui ont été correctement allouées à ce nœud. compter
    vmstat.numa_miss vide Nombre de pages qui ont été allouées sur ce nœud en raison d’une mémoire insuffisante sur le nœud prévu. compter
    vmstat.numa_foreign vide Nombre de pages initialement destinées à ce nœud qui ont été allouées à un autre nœud à la place. compter
    vmstat.numa_interleave vide Nombre de pages de politique d'entrelacement correctement allouées à ce nœud. compter
    vmstat.numa_local vide Nombre de pages allouées avec succès sur ce nœud par un processus sur ce nœud compter
    vmstat.numa_other vide Nombre de pages allouées sur ce nœud, par un processus sur un autre nœud. compter
    vmstat.workingset_refault vide
    vmstat.workingset_activate vide
    vmstat.workingset_nodereclaim vide
    vmstat.nr_anon_transparent_hugepages vide
    vmstat.nr_free_cma vide Pages d’allocation de mémoire continue libres dans chaque domaine de chaque NUMA
    vmstat.nr_dirty_threshold vide
    vmstat.nr_dirty_background_threshold vide
    vmstat.pgpgin vide Nombre de pages importées du disque compter
    vmstat.pgpgout vide Nombre de pages écrites sur le disque compter
    vmstat.pswpin vide Nombre de pages importées de l’espace d’échange compter
    vmstat.pswpout vide Nombre de pages échangées dans l’espace d’échange compter
    vmstat.pgalloc_dma vide
    vmstat.pgalloc_dma32 vide
    vmstat.pgalloc_normal vide
    vmstat.pgalloc_movable vide
    vmstat.pgfree vide Nombre de pages libres depuis le dernier démarrage compter
    vmstat.pgactivat vide Nombre d’activations de pages depuis le dernier démarrage compter
    vmstat.pgdeactivate vide Nombre de désactivations de pages depuis le dernier démarrage compter
    vmstat.pgfault vide Défauts mineurs depuis le dernier démarrage pages
    vmstat.pgmajfault vide Défauts majeurs depuis le dernier démarrage pages
    vmstat.pglazyfreed vide
    vmstat.pgrefill_dma vide
    vmstat.pgrefill_dma32 vide
    vmstat.pgrefill_normal vide Nombre de recharges de pages depuis le dernier démarrage compter
    vmstat.pgrefill_movable vide
    vmstat.pgsteal_kswapd_dma vide
    vmstat.pgsteal_kswapd_dma32 vide
    vmstat.pgsteal_kswapd_normal vide
    vmstat.pgsteal_kswapd_movable vide
    vmstat.pgsteal_direct_dma vide
    vmstat.pgsteal_direct_dma32 vide
    vmstat.pgsteal_direct_normal vide
    vmstat.pgsteal_direct_movable vide
    vmstat.pgscan_kswapd_dma vide
    vmstat.pgscan_kswapd_dma32 vide
    vmstat.pgscan_kswapd_normal vide Nombre de pages analysées par kswapd depuis le démarrage compter
    vmstat.pgscan_kswapd_movable vide
    vmstat.pgscan_direct_dma vide
    vmstat.pgscan_direct_dma32 vide
    vmstat.pgscan_direct_normal vide Nombre de pages récupérées depuis le démarrage compter
    vmstat.pgscan_direct_movable vide
    vmstat.pgscan_direct_throttle vide
    vmstat.zone_reclaim_failed vide
    vmstat.pginodesteal vide
    vmstat.slabs_scanned vide
    vmstat.kswapd_inodesteal vide
    vmstat.kswapd_low_wmark_hit_quickly vide
    vmstat.kswapd_high_wmark_hit_quickly vide
    vmstat.pageoutrun vide Nombre de fois où kswapd a appelé la récupération de page compter
    vmstat.allocstall vide Nombre de fois où la récupération de page a été appelée directement (mémoire faible) compter
    vmstat.pgrotated vide
    vmstat.drop_pagecache vide
    vmstat.drop_slab vide
    vmstat.numa_pte_updates vide
    vmstat.numa_huge_pte_updates vide
    vmstat.numa_hint_faults vide
    vmstat.numa_hint_faults_local vide
    vmstat.numa_pages_migrated vide
    vmstat.pgmigrate_success vide
    vmstat.pgmigrate_fail vide
    vmstat.compact_migrate_scanned vide
    vmstat.compact_free_scanned vide
    vmstat.compact_isolated vide
    vmstat.compact_stall vide Nombre de fois où un processus s’arrête pour exécuter le compactage de la mémoire afin qu’une page volumineuse soit libre d’utilisation. compter
    vmstat.compact_fail vide Nombre de fois où le système a tenté de compacter la mémoire, mais a échoué. compter
    vmstat.compact_success vide Nombre de fois où le système a compacté la mémoire et a libéré une page volumineuse en vue de l'utiliser. compter
    vmstat.htlb_buddy_alloc_success vide
    vmstat.htlb_buddy_alloc_fail vide
    vmstat.unevictable_pgs_culled vide
    vmstat.unevictable_pgs_scanned vide
    vmstat.unevictable_pgs_rescued vide
    vmstat.unevictable_pgs_mlocked vide
    vmstat.unevictable_pgs_munlocked vide
    vmstat.unevictable_pgs_cleared vide
    vmstat.unevictable_pgs_stranded vide
    vmstat.thp_fault_alloc vide Le nombre de pages volumineuses est alloué avec succès pour gérer une erreur de page. compter
    vmstat.thp_fault_fallback vide Le nombre d’erreurs de page ne parvient pas à allouer une page volumineuse et revient plutôt à l’utilisation de petites pages. compter
    vmstat.thp_collapse_alloc vide Le nombre de réductions d’une plage de pages en une page énorme, puis l’allocation réussie d’une nouvelle page énorme pour stocker les données. compter
    vmstat.thp_collapse_alloc_failed vide Le nombre de réductions d’une plage de pages en une seule page énorme mais l’allocation a échoué. compter
    vmstat.thp_split vide Le nombre de divisions d’une page volumineuse en pages de base compter
    vmstat.thp_zero_page_alloc vide Le nombre d’allocations réussies d’une énorme page zéro compter
    vmstat.thp_zero_page_alloc_failed vide Le nombre de fois où le noyau n’a pas réussi à allouer une énorme page zéro et se rabat à l’utilisation de petites pages. compter
    vmstat.balloon_inflate vide
    vmstat.balloon_deflate vide
    vmstat.balloon_migrate vide
    os.linux.metrics-process-status proc.<process>.VmSize nom_processus Quantité totale de mémoire virtuelle utilisée par le processus BC
    proc.<process>.VmRSS nom_processus Mémoire physique non échangée qu’un processus a utilisée BC
    proc.<process>.VmSwap nom_processus Quantité totale d'espace d'échange utilisée. BC

    Vérifications de la surveillance du réseau Linux

    Remarque :
    Lors de la mise à niveau à partir d’une version antérieure, ajoutez manuellement les vérifications de cette table à la politique de mesures Linux.
    Tableau 2. Politique de mesures Linux
    Type Vérification Description Utilisation et exemple d'utilisation Mesures collectées Mesure proposée
    Mesure os.linux.metrics-network-interface Récupère toutes les mesures liées à l’interface réseau pour les serveurs Linux.
    Utilisation :
    • -x, excludeinterface : liste des interfaces à exclure (séparées par des virgules)
    • -i, includeinterface : liste des interfaces à inclure (séparées par des virgules)
    • -I, includeinterfaceregex : correspondance regex interfaces à inclure
    • -X, excludeinterfaceregex : Regex correspondant aux interfaces à exclure

    Exemple d’utilisation : commande : metrics-network-interface.rb

    • rxBytes (mesure proposée)
    • rxPackets (mesure proposée)
    • rxErrors
    • rxDrops (mesure proposée)
    • rxFifo
    • rxFrame
    • rxCompressed
    • rxMulticast
    • rxBytes (mesure proposée)
    • rxPackets (mesure proposée)
    • rxErrors
    • rxDrops (mesure proposée)
    • rxFifo
    • rxColls
    • rxCarrier
    • rxCompressed
    yes
    Mesure os.linux.metrics-netstat-tcp Récupère les mesures sur les états des embases TCP à partir de netstat. Utile sur les serveurs Web ou proxy à fort trafic avec un grand nombre de connexions TCP de courte durée qui vont et viennent.
    Utilisation :
    • -p, port : port à partir duquel vous souhaitez recevoir les mesures. Plage de valeurs = 1-65535.
    • -t, type : type de port à partir duquel recevoir les mesures. Valeurs = local ou distant. Par défaut = local
    • -d, disabletcp6 : désactive la vérification tcp6. Entrez une valeur pour définir disabletcp6 = vrai.

    Exemple d’utilisation : metrics-netstat-tcp.rb

    • Tcp. INCONNU
    • Tcp. ÉTABLI
    • Tcp. SYN_SENT
    • Tcp. SYN_RECV
    • Tcp. FIN_WAIT1
    • Tcp. FIN_WAIT2
    • Tcp. TIME_WAIT
    • Tcp. FERMER
    • Tcp. CLOSE_WAIT
    • Tcp. LAST_ACK
    • Tcp. ÉCOUTER
    • Tcp. FERMETURE
    no