Regroupement automatisé d’alertes
Le regroupement automatisé d’alertes est un processus qui utilise des données historiques pour organiser automatiquement des alertes similaires en groupes. Ces alertes peuvent être des problèmes système, tels que des erreurs de serveur ou des pannes de réseau. En regroupant les alertes connexes, les équipes aident les équipes à identifier rapidement les schémas, à gérer les problèmes récurrents et à réduire le bruit causé par un trop grand nombre d’alertes individuelles.
Imaginez que vous surveillez le système de circulation d’une ville. Vous recevez beaucoup d’alertes, comme des rapports d’accidents, d’embouteillages et de fermetures de routes. Le regroupement automatisé d’alertes fonctionne comme un assistant intelligent qui organise ces alertes en fonction de modèles, de sorte que vous puissiez voir les problèmes associés ensemble et y répondre plus efficacement. Ces groupes d’alertes automatisés sont affichés dans le Liste express .Espace de travail pour l'exploitation des services
Comment activer ce regroupement
Pour activer l’automatisation basée sur l’apprentissage machine pour la corrélation des alertes, définissez la propriété Activer la corrélation d’automatisation basée sur ML (sa_analytics.specific_patterns_enabled) sur vrai.
Si le programme d’installation Prise en charge de domaine - Extensions de domaine est activé, des schémas d’agrégation d’alertes sont créés en fonction du niveau de domaine défini dans la propriété sa_analytics.agg.learner_domain_level. Par défaut, ce niveau de domaine est défini sur deux, ce qui correspond au deuxième niveau de la hiérarchie des domaines. Par exemple, dans une société, le niveau 1 peut représenter l’entreprise elle-même, tandis que le niveau 2 peut représenter les départements ou les équipes de l’entreprise. Les alertes sont regroupées en fonction de ce deuxième niveau, par exemple, en les triant par département ou par équipe. Pour en savoir plus, Séparation de domaine et Gestion des événements.
Comment ça marche
Le regroupement automatisé d’alertes utilise le machine learning (ML) et les données historiques pour identifier des schémas parmi les alertes. Elle examine des caractéristiques spécifiques, appelées identificateurs de modèle, telles que le type de problème, le système, le CI ou la mesure affectés qui se sont produits plusieurs fois au cours d’une même période, afin de déterminer si les alertes sont liées. L’apprenant Agrégation d’alertes utilise des algorithmes pour regrouper les alertes en fonction de modèles. Plus précisément, elle utilise des algorithmes basés sur des modèles et des méthodes probabilistes pour analyser les alertes entrantes et identifier celles qui sont connexes.
- Analyser les données historiques : le système étudie les alertes passées pour apprendre les schémas et les relations.
- Appliquer le machine learning : les algorithmes de machine learning analysent les données d’alerte historiques pour identifier des schémas et des relations entre les alertes. Cela permet au système d’apprendre des incidents passés et d’améliorer sa capacité à regrouper des alertes similaires au fil du temps.
- Regrouper les alertes similaires : les alertes avec des schémas correspondants sont automatiquement regroupées.
- 8h00 : Accident sur Main Street
- 8 h 05 : Embouteillage près de la rue Main
- 8 h 10 : Fermeture de la rue Main
Avantages
- Trouvez des problèmes récurrents : repérez rapidement les schémas (comme un serveur qui surchauffe constamment).
- Gagnez du temps : gérez des groupes d’alertes connexes plutôt que des alertes individuelles.
- Améliorer la réponse : Concentrez-vous sur la recherche de la cause profonde plutôt que sur le traitement des problèmes épars.