アラート集計
アラート集計機能は、アラートデータ分析とアラート集計を備えた イベント管理 を拡張します。アラート集計を使用すると、リアルタイム受信アラートを整理し、アラートのノイズを減らせます。
多くの場合、顧客は高いアラートノイズに対処し、平均修理時間 (MTTR) が長くなります。論理的にグループ化されていない多くのアラートの仲介には、多大なオーバーヘッドが伴います。
アラート集計は、アラートを管理する多くの方法の 1 つです。アラートを集計するには、いくつかの方法があります。ユーザーが定義したロジック (手動、ルールベース、またはタグクラスター) に基づくものと、微調整が可能なその他の最先端のアルゴリズム (自動、CMDB、テキストベース、ログ分析) に基づくものがあります。ルールベースのアラートと手動アラートでは、動作に違いがあります。主な違いは、グループの作成時に、実際のアラートの 1 つが親アラートとして選択されることです。自動、CMDB、テキストベースモードでは、実際のアラートの親である仮想アラートを作成できます。仮想アラートのプロトタイプは、グループ内で最も古く、最も重大なアラートです。
アラートグループは、親アラートと子アラートで構成されます。親アラートは、実際のアラート (手動、ルールベース、およびログ分析) または仮想アラート (自動、CMDB、テキストベース、またはタグクラスター) にすることができます。
アラートを自動、CMDB、およびテキストベースグループにグループ化するには、通常は 1 分に 1 回実行されるスケジュール設定済みジョブ「Service Analytics group alerts using RCA/Alert Aggregation」が使用されます。
- sa_analytics.aggregation_enabled パラメーター。自動アラートグループを作成できるようにするには、[自動グループ、CMDB グループ、およびテキストベースグループのアラートの集計を有効にします] プロパティを true に設定します。
- sa_analytics.agg.query_dynamic_window パラメーター。デフォルトでは 10 分に設定されています。このパラメーターは、グループに追加できる 2 つのアラートの前回のイベント生成時刻間の最大時間差を定義します。デフォルト値は 600 秒 (10 分) です。
- sa_analytics.agg.query_max_group_lifetime パラメーター。最初のアラートの最後のイベント生成から、グループ内の最後のアラートの最後のイベント生成までの最大期間。このパラメーターは、デフォルトで 1800 秒 (30 分) に設定されています。注:イベントが 1800 秒を超える遅延で到着した場合は、 sa_analytics.agg.group_expiration_time パラメーターに 1800 秒を超える値を定義することによって、アラートの最後のイベント生成をグループに関連付けることができます。
例:同じ CI を持つ次のアラートがあるとします。(すべてを同じ CMDB グループに追加できます)。
- アラート 1: 最後のイベント生成 01:00:00 AM
- アラート 2:最後のイベント生成 01:11:00 AM
- アラート 3: 最後のイベント生成 01:13:00 AM
- アラート 4: 最後のイベント生成 01:16:00 AM
- アラート 5: 最後のイベント生成 01:25:00 AM
- アラート 6: 最後のイベント生成 01:34:00 AM
- アラート 7: 最後のイベント生成 01:43:00 AM
アラート 1 とアラート 2 の時間差は 10 分を超えているため、グループ化されません。
アラート 2 とアラート 3 は、1:13:00 にグループを作成します。
- アラート 4 が 1:16:00 にグループに追加され、10 分間の動的ウィンドウが再開されます。
- アラート 5 は、最後のイベント生成時刻が 1:16:00 から 10 分以内であるため、グループに追加されます。
- アラート 6 はグループに追加されます。
- アラートを集計して、自動化アラートグループを作成します。
タイムスタンプと CI ID に従ってアラートを関連付け、自動アラートグループを作成します。
- CMDB 内の CI の関係性に基づいてアラートを関連付け、CMDB アラートグループを作成します。
- NLP (自然言語処理) を使用して、アラートのテキストの類似性に基づいてアラートを関連付けます。
- の アラートグループへのアラートの追加 パターンを生成し、そのパターンに従って自動アラートグループを作成します。
イベント管理 では、類似しているが必ずしも同じではないアラートをグループ化します。またグループ化は、アラートの最後のイベント生成時刻の近接度に基づきます。同じ CI を含むアラートがグループ化されます。
- アラート集計学習 (サービス分析でのアラート集計学習 - 日次):過去のアラートを処理するために毎日実行されるオフラインジョブであり、統計分析を実行してアラートのパターンを構築します。詳細については、「パターンベースのアラート集計の構成」を参照してください。
- リアルタイムアラート集計ジョブ (サービス分析での RCA/アラート集計を使用したグループアラート) - 毎分実行され、アラートパターン、CMDB 関係、およびテキストの類似性に基づいてアラート集計グループを生成します。