Alertes de seuil de ressources de serveur MID

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 9 minutes de lecture
  • L’instance affiche des avertissements lorsqu’un serveur MID dépasse ses seuils de ressources pour l’utilisation du processeur et de la mémoire JVM, ce qui permet aux utilisateurs de créer des notifications par e-mail ou des scripts personnalisés en cas de violation.

    La table MID Server Issue (Problème de serveur MID) [ecc_agent_issue] avertit les utilisateurs lorsqu’un serveur MID dépasse les seuils configurés des ressources de processeur et de mémoire qui lui sont allouées. Ces avertissements sont publiés avant que le serveur MID ne subisse une dégradation des performances ou une erreur de mémoire insuffisante, ce qui permet à l’administrateur d’augmenter les ressources et d’éviter les temps d’arrêt. Les administrateurs peuvent utiliser un événement enregistré pour envoyer une notification par e-mail aux destinataires sélectionnés, les avertissant de tout dépassement de seuil, ou pour créer un script personnalisé pour effectuer un autre type de travail. L’instance continue de mettre à jour la table MID Server Issue (Problème de serveur MID) [ecc_agent_issue] pour tenir à jour les problèmes non résolus.

    Par défaut, les alertes de seuil de processeur et de mémoire sont désactivées et aucune alerte n’est publiée dans la table MID Server Issue [ecc_agent_issue]. Pour activer les deux types d’alerte, ajoutez ces propriétés à la table Propriétés système [sys_properties], puis définissez leurs valeurs sur vrai :
    • mid.threshold.resource.breach.enable.cpu.alerts
    • mid.threshold.resource.breach.enable.memory.alerts
    Pour plus d’informations sur l’ajout de propriétés système à la plateforme, consultez Ajouter une propriété à l’aide de sys_properties.list.

    Processus d’évaluation

    Ce traitement se produit, que l’alerte soit activée ou non :
    1. Toutes les 10 minutes, chaque serveur MID transmet les mesures de consommation de son processeur et de sa mémoire à l’instance. L’instance insère les mesures de processeur dans le champ % moyen de processeur utilisé de la table Mesures scalaires d’agent ECC [ecc_agent_scalar_metric] et les mesures de mémoire dans le champ % maximal de mémoire utilisée de la table Mesures de mémoire d’agent ECC [ecc_agent_memory_metric].
    2. Après une insertion réussie, les règles métier suivantes s’exécutent sur chaque table, en invoquant un include de script qui appelle une fonction appropriée. Chaque fonction utilise une moyenne des ensembles de mesures insérés dans les tables, en fonction des intervalles d’échantillonnage configurés.
      • Mettre à jour la moyenne du processeur sur le serveur MID État : appelle l’include de script MIDResourceThresholdBreach.checkCpuUsage().
      • Mettre à jour la mémoire maximale sur le serveur MID État : appelle l’include de script MIDResourceThresholdBreach.checkMemoryUsage .
      Chaque fonction utilise une moyenne des ensembles de mesures insérés dans les tables, en fonction des seuils et des intervalles d’échantillonnage configurés. L’instance examine d’abord chaque serveur MID à la recherche de paramètres de configuration qui définissent des valeurs de seuil personnalisées ou des intervalles d’échantillonnage pour ce serveur MID. Si aucun paramètre de configuration n’est trouvé pour ces attributs, l’instance recherche des valeurs personnalisées à utiliser dans la table Propriétés système [sys_properties]. Si aucune propriété n’est trouvée, l’instance utilise les valeurs de seuil et d’intervalle par défaut du code.
      Remarque :
      Les pourcentages de seuil et les intervalles d’échantillonnage sont configurables. Consultez Configuration des seuils et des intervalles d’échantillonnage pour en savoir plus.

    Processus d’alerte

    Lorsque l’alerte pour les seuils de processeur ou de mémoire est activée, ce traitement se produit :
    1. Si la valeur moyenne agrégée de la mesure est égale ou dépasse le seuil de pourcentage configuré, l’instance déclenche l’événement mid.threshold.resource.breach . Les administrateurs peuvent utiliser cet événement pour créer des notifications par e-mail pour les alertes de non-respect du seuil ou pour créer un script personnalisé.
    2. L’instance insère un enregistrement de la violation dans la table MID Server Issue (Problème de serveur MID) [ecc_agent_issue] avec la valeur d’étatNouveau et un décompte de 1, puis publie un message contenant tous les détails pertinents de la violation. Par exemple , le % moyen du processeur utilisé a dépassé le seuil (96>=91) pendant une intervalle de 40 minutes, survenant après la date de début 2017-01-11 14:25:19. Ce message s’affiche dans le champ Short description (Description courte ) du formulaire MID Server Issue (Problème de serveur MID) et lors de l’événement. Vous pouvez copier n’importe quelle partie du message dans vos notifications par e-mail.

    États des problèmes du serveur MID

    Lorsque l’administrateur examine pour la première fois un problème dans la table Problème de serveur MID [ecc_agent_issue], il peut modifier l’état du problème sur Authentifié pour indiquer que le problème est en cours de résolution. Chaque fois que l’instance détecte une violation, elle tente de faire correspondre la violation à un problème existant. Si un serveur MID a déjà un enregistrement de problème lié à cette violation avec l’étatNouveau ou Confirmé, l’instance met à jour le champ Dernier détecté avec la date et l’heure actuelles et incrémente le champ Nombre dans l’enregistrement existant. Cela empêche la création d’enregistrements en double dans la table MID Server Issue (Problème de serveur MID) [ecc_agent_issue] et enregistre le nombre de fois où la violation s’est reproduite après l’incident initial. L’administrateur peut augmenter progressivement les ressources du serveur MID et observer l’effet sur le champ Nombre . Lorsque le compteur cesse de s’incrémenter, l’administrateur sait que le serveur MID dispose des ressources adéquates. Lorsque la ressource du serveur MID a été ajustée de manière appropriée, l’administrateur définit l’état sur Résolu. Si un nouveau dépassement de seuil est enregistré qui correspond à un problème de serveur MID avec un étatrésolu, l’instance crée un nouvel enregistrement de problème.
    Remarque :
    Tout enregistrement de la table MID Server Issue [ecc_agent_issue] qui n’a pas été mis à jour depuis 30 jours est supprimé, quel que soit son état.

    Recommandations pour résoudre les problèmes de ressources

    Les administrateurs ont la possibilité de résoudre les problèmes de ressources avec un serveur MID lorsqu’ils reçoivent une notification de l’événement. Suivez ces recommandations pour réduire la pression sur les ressources du serveur MID :
    • Mémoire JVM :
      • Allouez plus de mémoire maximale au serveur MID. Pour plus d'informations, consultez Définir la taille de la mémoire JVM du serveur MID.
      • Ajoutez des serveurs MID supplémentaires pour partager la charge de travail. Pour plus d'informations, consultez Grappes de serveurs MID.
      • Réduisez la quantité de traitement simultané pour le serveur MID. Cela inclut la segmentation des plages d’adresses IP en segments plus petits pour un calendrier de découverte ou le chargement de segments plus petits de données dans une tâche d’importation.
    • Processeur : réduisez l’activité sur l’hôte ou migrez le serveur MID vers un nouvel hôte disposant de plus de ressources.
      Remarque :
      Le serveur MID peut créer un pic d’utilisation des ressources pendant la découverte, en particulier lors de la détection sur un grand nombre de cibles ou de l’exécution simultanée de plusieurs sessions Power Shell. L’utilisation des ressources de l’hôte du serveur MID revient automatiquement à la normale après l’arrêt réussi de l’exécution de Découverte. Pour réduire l’utilisation du processeur, hébergez le serveur MID sur un ordinateur dédié. Si vous rencontrez des problèmes d’utilisation des ressources, assurez-vous qu’un seul serveur MID est exécuté sur chaque ordinateur hôte dédié. Si le serveur MID est hébergé sur un cloud public, ajoutez plus de ressources CPU et évitez le problème de voisinage bruyant. Pour plus d’informations, consultez Utilisation élevée du processeur sur un hôte avec un ou plusieurs serveurs MID [KB0597639].

    Tables utilisées pour l’évaluation du seuil de ressources

    Table Description
    Problème de serveur MID [ecc_agent_issue] Stocke des données sur divers types de problèmes de serveur MID, y compris les dépassements des seuils configurés de processeur et de mémoire. Les champs utilisés pour les dépassements de seuil de ressources sont les suivants :
    • nombre : nombre de fois qu’un dépassement de seuil précédemment signalé se produit, si l’événement n’est pas marqué comme résolu.
    • last_detected : date et heure actuelles auxquelles un dépassement de seuil est détecté. Ce champ est mis à jour chaque fois qu’une violation précédemment détectée est trouvée, s’il n’est pas marqué comme Résolu.
    • message : message descriptif résumant les conditions qui ont déclenché l’événement de dépassement de seuil. Ce message inclut le pourcentage réel de processeur et de mémoire calculé et les seuils configurés qui ont été dépassés.
    • mid_server : nom du serveur MID qui subit le dépassement du seuil de ressources.
    • source : source du problème à l’origine de la violation. Voici les sources possibles :
      • CpuMIDResourceThresholdBreach : sources du problème de seuil de processeur.
      • MemoryMIDResourceThresholdBreach : sources du problème de seuil de mémoire.
    État du serveur MID [ecc_agent_status] Stocke les pourcentages utilisés pour les ressources de processeur et de mémoire, en moyenne sur des intervalles configurables pour chaque ressource. Les champs utilisés sont les suivants :
    • % moyen du processeur utilisé
    • % max. mémoire utilisée
    Mesure scalaire d’agent ECC [ecc_agent_scalar_metric] Stocke les données d’utilisation du processeur insérées par chaque serveur MID toutes les 10 minutes. Le champ de table utilisé par les alertes de seuil de ressource est moyen.
    Mesure de mémoire d’agent ECC [ecc_agent_memory_metric] Stocke les données d’utilisation de la mémoire insérées par chaque serveur MID toutes les 10 minutes. Le champ de table utilisé par les alertes de seuil de ressource est max_used_pct.

    Règles métier qui vérifient les dépassements de seuil

    Règle métier Description
    Mettre à jour la moyenne du processeur sur l’état du serveur MID S’exécute après que le serveur MID a inséré un enregistrement dans la table ECC Agent Scalar Metric [ecc_agent_scalar_metric]. Cette règle métier déclenche la fonction d’include de script MIDResourceThresholdBreach qui évalue les paramètres de seuil pour déterminer si le serveur MID a dépassé les seuils de ressources de processeur configurés.
    Mettre à jour la mémoire maximale sur l’état du serveur MID S’exécute après que le serveur MID a inséré un enregistrement dans la table ECC Agent Memory Metric [ecc_agent_memory_metric]. Cette règle métier déclenche la fonction d’include de script MIDResourceThresholdBreach qui évalue les paramètres de seuil pour déterminer si le serveur MID a dépassé les seuils de ressources de mémoire configurés.

    Configuration des seuils et des intervalles d’échantillonnage

    Vous pouvez utiliser les pourcentages de seuil et les intervalles d’échantillonnage par défaut ou configurer des valeurs personnalisées à l’aide de l’une des méthodes suivantes :
    Les propriétés système et les paramètres de configuration utilisent les mêmes noms.
    Paramètre de propriété/de configuration Description
    mid.threshold.mean_cpu.aggregate_interval_span Nombre d’unités de 10 minutes dans l’intervalle pour l’échantillonnage des données d’utilisation du processeur. L’intervalle par défaut est de 30 minutes (3 x 10 minutes).

    Par défaut : 3

    mid.threshold.mean_cpu,pour cent Pourcentage d’utilisation du total des ressources de processeur qui déclenche une alerte de violation de seuil.

    Par défaut : 95

    mid.threshold.mean_max_memory.aggregate_interval_span Nombre d’unités de 10 minutes dans l’intervalle d’échantillonnage des données d’utilisation de la mémoire. L’intervalle par défaut est de 30 minutes (3 x 10 minutes).

    Par défaut : 3

    mid.threshold.mean_max_memory,pour cent Pourcentage d’utilisation du total des ressources mémoire à l’origine d’une alerte de dépassement de seuil.

    Par défaut : 95

    Génération de rapports sur les ressources de serveur MID

    Le tableau de bord MID Server (Serveur MID ) contient deux rapports qui vous donnent une vue de la consommation des ressources CPU et mémoire JVM. Ces rapports montrent l’utilisation au cours des 30 derniers jours.
    • Avg Percentage of CPU Used (Pourcentage moyen du processeur utilisé) : la tendance de la moyenne quotidienne de l’utilisation du processeur permet d’illustrer la quantité de traitement du processeur consommée par l’hôte du serveur MID. Les serveurs MID déployés sur le même hôte signaleront la même utilisation du processeur.
    • Avg Percentage of Max Memory Used (Pourcentage moyen de mémoire maximale utilisée) : le pourcentage maximal d’utilisation (max_used_pct) est une mesure utile pour déterminer si le serveur MID dispose de ressources mémoire suffisantes. Cette mesure est un pourcentage de la mémoire maximale utilisée par rapport à la mémoire totale disponible. La tendance au fil du temps permet de visualiser la quantité de mémoire nécessaire au serveur MID.