Automatisation des alertes dans Espace de travail pour l'exploitation des services pour ITOM

Gestion des opérations IT Xanadu

Release

xanadu

ft:locale

fr-FR

ft:publication_title

Gestion des opérations IT Xanadu

ft:clusterId

itom

bundleId

itom

workflow

Technology

Automatisation des alertes dans Espace de travail pour l'exploitation des services pour ITOM

Rversion finale: Xanadu

Mis à jour 1 août 2024

3 minutes de lecture

L’automatisation des alertes est cruciale, car les entreprises font face à un nombre croissant d’alertes et à des infrastructures informatiques complexes. Le traitement manuel des alertes est lent, sujet aux erreurs et inefficace, ce qui souligne la nécessité de systèmes automatisés. L’automatisation peut améliorer le délai moyen de résolution des alertes, améliorer la fiabilité du service et mieux adapter les ressources en personnel.

Les automatisations d’alertes prennent également en charge les rôles d’administrateur centralisé et d’équipe distribuée. Cela permet aux équipes qualifiées de se mettre en libre-service et de créer leurs propres automatisations d’alerte. Par exemple, vous pouvez envisager d’accorder l’accès aux SRE (Site Reliability Engineers). Les membres d’équipes peuvent gérer les automatisations pour leur propre équipe et leurs propres alertes sans impact sur les autres équipes.

Pour les utilisateurs familiers avec notre expérience classique, l’automatisation des alertes offre une interface utilisateur simplifiée et une meilleure prise en charge de l’équipe pour les règles d’événements, les définitions de regroupement basées sur les balises et les règles de gestion des alertes. Certaines fonctionnalités avancées ne sont actuellement disponibles que pour les administrateurs dans l’expérience classique. Ces deux expériences utilisent les mêmes tables back-end. Vous pouvez utiliser l’expérience qui vous convient le mieux, et les changements apportés à l’une mettront également à jour l’autre.

Page d’automatisation des alertes avec option permettant de créer une automatisation pour enrichir, regrouper ou escalader et notifier. — Figure 1. Page d’automatisation des alertes

Types d’automatisation des alertes

Actuellement, Espace de travail pour l'exploitation des services ITOM fournit les types d’automatisation suivants.

Ignorer l’automatisation : réduisez les alertes non pertinentes ou faussement positives, gérez efficacement la fatigue liée aux alertes en filtrant les notifications bruyantes et permettez aux équipes de se concentrer sur les problèmes critiques.
Enrichir l’automatisation : améliorez les alertes brutes avec des informations contextuelles pour les rendre plus informatives et exploitables. En termes simples, il s’agit de prendre les événements bruts générés par les outils de surveillance et de les transformer en un format commun et standard pour faciliter le regroupement et la réponse automatisés.
Automatisation de groupe : regroupez plusieurs alertes connexes dans une alerte primaire unique pour réduire le bruit des alertes et identifier la cause première.
Automatisation des réponses : répondez automatiquement aux alertes en notifiant les personnes concernées appropriées, escaladez-les si nécessaire ou exécutez des actions de correction. Déterminez comment et quand les alertes sont escaladées en fonction de la gravité ou du type. Intégrez des systèmes tiers pour créer des tickets, des notifications ou exécuter des actions de rattrapage.

Flux de processus d’automatisation des alertes

Vous pouvez commencer par envoyer des alertes ou des événements à partir des systèmes de surveillance ou ServiceNow utiliser la zone de lancement des intégrations. C’est là que les administrateurs établissent des connexions et ServiceNow des outils de surveillance. Ces intégrations permettent de collecter des données surveillées, en générant des événements provenant de sources tierces.

Lorsque les alertes sont reçues par ServiceNow, les automatisations d’alerte s’exécutent dans l’ordre affiché sur la page. Tout d’abord, nous ignorons les alertes pour réduire le bruit. Ensuite, nous enrichissons les alertes avec un contexte supplémentaire, puis nous regroupons les alertes à l’aide du contexte ajouté. Enfin, nous répondons aux alertes en escaladant ou en exécutant des corrections. Il peut y avoir plusieurs automatisations pour chaque type. Chaque automatisation s’exécute en fonction de conditions de déclenchement spécifiques et exécute des actions spécifiques. Les alertes ne sont automatisées que lorsqu’elles sont reçues. Nous n’appliquons aucune automatisation aux alertes passées.

Au cours de la phase d’enrichissement des alertes, les administrateurs ajoutent ou extraient les champs nécessaires des alertes afin de fournir les informations essentielles pour une résolution rapide. Cela permet de s’assurer que les alertes contiennent tous les détails pertinents nécessaires à une réponse efficace aux incidents. Les administrateurs ajoutent du contexte aux alertes en les modifiant et en les normalisant. Cela améliore la corrélation des alertes, ce qui facilite l’identification des modèles et des menaces potentielles.

Les alertes enrichies et composées sont ensuite regroupées en fonction de critères prédéfinis, consolidant ainsi les alertes associées. Cela réduit la fatigue liée aux alertes et facilite une remédiation efficace. Enfin, les alertes escaladées déclenchent des notifications aux personnes concernées par le biais de différents canaux, ce qui garantit une communication et une réponse en temps opportun aux alertes critiques.

Le schéma suivant illustre ce flux de processus.

Diagramme de la façon dont l’automatisation des alertes fonctionne pour réduire le bruit et améliorer le délai de résolution. — Figure 2. Automatisation des alertes : réduction du bruit et amélioration du délai de résolution

Ce processus complet d’automatisation des alertes permet de réduire le bruit des alertes, d’améliorer le délai moyen de résolution (MTTR), d’améliorer la fiabilité du service et d’augmenter la productivité du personnel.