Automatisation des alertes dans Espace de travail pour l'exploitation des services pour ITOM

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 3 minutes de lecture
  • L’automatisation des alertes est cruciale car les organisations font face à un nombre croissant d’alertes et à des infrastructures informatiques complexes. Le traitement manuel des alertes est lent, sujet aux erreurs et inefficace, ce qui souligne la nécessité de systèmes automatisés. L’automatisation peut améliorer le temps moyen de résolution des alertes, améliorer la fiabilité du service et mieux faire évoluer les ressources humaines.

    Les automatisations d’alerte prennent également en charge les rôles d’administrateur centralisé et d’équipe distribuée. Cela permet aux équipes qualifiées de se servir elles-mêmes et de créer leurs propres automatisations d’alerte. Par exemple, vous pouvez envisager d’accorder l’accès aux SRE (Site Reliability Engineers). Les membres des équipes peuvent gérer les automatisations de leur propre équipe et de leurs propres alertes sans impact sur les autres équipes.

    Pour les utilisateurs familiarisés avec notre expérience classique, l’automatisation des alertes offre une interface utilisateur simplifiée et une meilleure prise en charge des équipes pour les règles d’événements, les définitions de clustering basées sur les balises et les règles de gestion des alertes. Certaines fonctionnalités avancées ne sont actuellement disponibles que pour les administrateurs dans l’expérience classique. Ces deux expériences utilisent les mêmes tables back-end. Vous pouvez utiliser l’expérience qui vous convient le mieux, et les modifications apportées à l’une mettront également à jour l’autre.

    Figure 1. Page d’automatisation des alertes
    Page d’automatisation des alertes avec option de création d’automatisation pour enrichir, regrouper ou escalader et notifier.

    Types d’automatisations des alertes

    Actuellement, Espace de travail pour l'exploitation des services ITOM fournit les types d’automatisation suivants.

    1. Ignorer l’automatisation : réduisez les alertes non pertinentes ou les faux positifs, gérez efficacement la fatigue liée aux alertes en filtrant les notifications bruyantes et permettez aux équipes de se concentrer sur les problèmes critiques.
    2. Enrichissez l’automatisation : améliorez les alertes brutes avec des informations contextuelles pour les rendre plus informatives et exploitables. En termes simples, cela implique de prendre les événements bruts générés par les outils de surveillance et de les transformer en un format commun et standard pour faciliter le regroupement et la réponse automatisés.
    3. Automatisation de groupe : regroupez plusieurs alertes connexes en une seule alerte primaire pour réduire le bruit des alertes et identifier la cause première.
    4. Automatisation des réponses : répondez automatiquement aux alertes en informant les personnes concernées appropriées, escaladez-les si nécessaire ou exécutez des actions de correction. Déterminez comment et quand les alertes sont escaladées en fonction de leur gravité ou de leur type. Intégrez à des systèmes tiers pour créer des tickets, des notifications ou exécuter des actions de correction.

    Flux de processus d’automatisation des alertes

    Vous pouvez commencer par envoyer des alertes ou des événements depuis les systèmes de surveillance vers ServiceNow l’utilisation de la zone de lancement des intégrations. Il s’agit de l’endroit où les administrateurs établissent des connexions entre ServiceNow les outils de surveillance et les outils de surveillance. Ces intégrations permettent de collecter des données surveillées et de générer des événements à partir de sources tierces.

    Lorsque les alertes sont reçues par ServiceNow, les automatisations d’alerte s’exécutent dans l’ordre indiqué sur la page. Tout d’abord, nous ignorons les alertes pour réduire le bruit. Ensuite, nous enrichissons les alertes avec du contexte supplémentaire, puis nous regroupons les alertes à l’aide du contexte ajouté. Enfin, nous répondons aux alertes en effectuant des remontées ou en exécutant des remédiations. Il peut y avoir plusieurs automatisations pour chaque type. Chaque automatisation s’exécute en fonction de conditions de déclenchement spécifiques et exécute des actions spécifiques. Les alertes ne sont automatisées que lorsqu’elles sont reçues ; Nous n’appliquons pas d’automatisations aux alertes passées.

    Dans la phase d’enrichissement des alertes, les administrateurs ajoutent ou extraient les champs nécessaires des alertes pour fournir des informations essentielles à une résolution rapide. Cela garantit que les alertes contiennent tous les détails pertinents nécessaires à une réponse efficace aux incidents. Les administrateurs ajoutent du contexte aux alertes en les modifiant et en les normalisant. Cela améliore la corrélation des alertes, ce qui facilite l’identification des modèles et des menaces potentielles.

    Les alertes enrichies et composées sont ensuite regroupées en fonction de critères prédéfinis, consolidant ainsi les alertes associées. Cela réduit la fatigue liée aux alertes et facilite un rattrapage efficace. Enfin, les alertes escaladées déclenchent des notifications aux parties prenantes via différents canaux, garantissant une communication et une réponse rapides aux alertes critiques.

    Le diagramme suivant illustre ce flux de processus.
    Figure 2. Automatisation des alertes : réduction du bruit et amélioration du délai de résolution
    Diagramme du fonctionnement de l’automatisation des alertes pour réduire le bruit et améliorer le délai de résolution.

    Ce processus complet d’automatisation des alertes peut réduire le bruit des alertes, améliorer le délai moyen de résolution (MTTR), améliorer la fiabilité des services et augmenter la productivité du personnel.