自動アラートグループ化
自動アラートグループ化とは、履歴データを使用して類似のアラートを自動的にグループに編成するプロセスのことです。こうしたアラートは、サーバーエラーやネットワーク停止などのシステムの問題である場合があります。関連するアラートをグループ化することで、チームはパターンをすばやく特定し、繰り返し発生する問題に対処し、個々のアラートが多すぎることによるノイズを減らすことができます。
都市の交通システムを監視していると想像してください。事故、交通渋滞、通行止めなどの報告のように、多くのアラートが届きます。自動アラートグループ化は、パターンに基づいてこれらのアラートを整理するスマートアシスタントのように機能するため、関連する問題をまとめて確認し、より効率的に対応できます。こうした自動アラートグループは、サービスオペレーションワークスペース内の エクスプレスリスト に表示されます。
このグループ化を有効にする方法
アラート相関に関して機械学習ベースの自動化を有効にするには、プロパティ [ML ベースの自動化相関を有効にする] (sa_analytics.specific_patterns_enabled) を true に設定します。
Domain Support - Domain Extensions Installer がアクティブ化されている場合、アラートアグリゲーションパターンは、sa_analytics.agg.learner_domain_level プロパティで定義されたドメインレベルに基づいて作成されます。デフォルトでは、このドメインレベルは 2 (ドメイン階層の第 2 レベルに相当) に設定されています。たとえば、会社では、レベル 1 が会社自体を表し、レベル 2 が社内の部門またはチームを表すと考えられます。アラートは、部門やチームでソートするなど、この第 2 レベルに基づいてグループ化されます。詳細については、「ドメインセパレーションと イベント管理」を参照してください。
仕組み
自動アラートグループ化では、機械学習 (ML) と履歴データを使用してアラート間のパターンを特定します。パターン識別子と呼ばれる特定の特性 (問題のタイプ、影響を受けるシステム、CI、またはほぼ同じ期間に複数回発生したメトリクスなど) を調べて、アラートが関連しているかどうかを判断します。 アラートアグリゲーション学習では、アルゴリズムを使用して、パターンに基づいてアラートをグループ化します。具体的には、パターンベースのアルゴリズムと確率的手法を使用して、受信アラートを分析し、関連するアラートを特定します。
- 履歴データの分析:システムで過去のアラートを調査して、パターンと関係を学習します。
- 機械学習の適用:ML アルゴリズムでアラートの履歴データを分析して、アラート間のパターンと関係を特定します。これにより、システムは過去のインシデントから学習し、時間の経過とともに類似のアラートをグループ化する機能を向上させることができます。
- 類似のアラートをグループ化:一致するパターンを持つアラートが自動的にグループ化されます。
- 8:00 AM:メインストリートで事故
- 8:05 AM:メインストリート付近で交通渋滞
- 8:10 AM:メインストリートで通行止め
メリット
- 繰り返し発生する問題の検出:パターン (サーバーが常に過熱しているなど) をすばやく特定します。
- 時間の短縮:個々のアラートではなく、関連するアラートのグループを処理します。
- 対応の改善:ばらばらな問題に対処するのではなく、根本原因の修正に重点を置きます。