ヘルスログアナリティクスアラートの分析と解決
ログデータを調査して根本原因を特定することで、 ヘルスログアナリティクス アラートを分析および解決します。次に、根底にある問題を解決するためのアクションを実行します。
ヘルスログアナリティクスアラートの分析と解決の概要
オペレーターは、 ヘルスログアナリティクスによって生成されたアラートを分析して解決する責任があります。HLA がアラートを作成するときは、アラートの重大度、影響を受ける構成アイテム (CI)、例外に関連付けられたログデータ、および影響を受けるサービスを確認します。例外の周囲にあるログを調査して根本原因を特定しようとします。ログビューアーを使用すると、タイムスタンプまたは範囲でアラートログを参照し、例外ログ行の頻度をチャートで可視化できます。さらに、ログコリレーターを使用してアラート間の相関を検出することもできます。アラートの根本原因を特定したら、問題を解決するために必要な手順を実行して、システムの健全性を確保し、サービスの中断を最小限に抑えます。たとえば、問題の解決に役立つ可能性のある情報を提供するために、独自のナレッジベース (KB) 記事をアラートに追加できます。
- [概要] タブからの ログアナリティクス アラートの修復の開始
アラートの [概要] タブから、ヘルスログアナリティクスアラートの修復プロセスを開始します。このタブには、アラート、例外動作に関連付けられたログデータ、アラートに関連付けられた CI、およびアラートの影響を受けるサービスに関する情報が表示されます。
- 例外の周囲にあるログの分析
障害が発生しているシステムの状態に関する手掛かりがないか、異常の周囲にあるログを確認します。この情報は、問題の根本原因を絞り込むのに役立ちます。
- ログビューアーでのアラートのログの確認
[ ログビューアー ] タブを使用して、タイムスタンプまたは時間範囲でアラートログを参照し、一定期間の例外の頻度を可視化します。指定した時間範囲のログデータの包括的なビューを提供することで、根本原因の調査に役立ちます。
- ログコリレーターを使用したログデータ内の関係の識別
アラート間の関係を識別して、アラートがより大きな問題の一部であるかどうかを判断するのに役立ちます。
- アラートへの KB 記事の追加
ヘルスログアナリティクスによって生成されたアラートに独自のナレッジベース (KB) 記事を追加します (たとえば、問題の解決に役立つ可能性のある情報を提供します)。
アラートの生成に関連するタスク
以下で説明するいずれかのタスクを実行して、アラートの生成と優先順位付け、異常の特定、および重要でない問題のアラートの削除によるノイズの削減方法を ヘルスログアナリティクス 制御できます。
- アラートルールを使用してアラートを生成するタイミングを制御するヘルスログアナリティクス
アラートルールを追加、変更、または削除して、指定したメトリクスの ログアナリティクス アラートを生成できます。
- アラートに高いまたは低い重大性をアサインする
アラートに高いまたは低い重要度を割り当てて、 ヘルスログアナリティクス が生成するアラートに優先順位を付けることができます。
- レキシカルキーワードによる例外検出への影響
ログデータ内で検索するキーワードを管理することで、 ヘルスログアナリティクス による例外の検出方法に影響を与えることができます。
- 詳細なログアラートフィルターの追加によるノイズの低減
詳細ログアラートフィルターを使用すると、重大な問題を示さないアラートを削除することで、ノイズを減らすことができます。