メトリックインテリジェンスのセルフヘルスモニタリング
イベント管理 セルフ健全性モニターは、メトリックインテリジェンスのインフラストラクチャコンポーネントやプロセスの健全性を監視し、潜在的な問題についてアラートを発生させます。セルフヘルスモニタリングにより問題を積極的に修復し、データ損失を最小限に抑えることができます。
メトリックインテリジェンスは、イベント管理 セルフ健全性モニターを使用して必要なコンポーネントとプロセスが適切に機能していることを確認するように事前構成されています。モニターが問題を検出すると、イベント管理 セルフヘルスモニタリングシステムによって問題のイベントが作成されます。これらのイベントは イベント管理 アラートに変換されるか、前のアラートに追加されます。メトリックインテリジェンスのセルフ健全性モニターは、60 秒ごとに実行されます。
たとえば、メトリックインテリジェンスの MID サーバー分散クラスターが問題に遭遇した場合、イベントは [メジャー] ステータスとして生成されます。その後、このイベントはアラートに変換されます。後で問題が解決されると、新しいイベントが [情報] ステータスとして生成され、元のアラートはクローズされます。
監視対象のコンポーネントとプロセス
| コンポーネント / プロセスのチェック | エラーの条件 |
|---|---|
| メトリックインテリジェンス拡張が正常に動作している | モニターによりecc_agent_ext_context_metricテーブルのstatusフィールドをチェックして、[エラー] または [警告] のステータスを検出します。 |
| メトリックインテリジェンスの MID サーバー分散クラスターが正常に動作している | モニターによりecc_agent_clusterテーブルのstatusフィールドをチェックして、[エラー]、[セグメント] または [停止] のステータスを検出します。 注: ステータスが [停止] の場合は、error_messageフィールドが空でない場合にのみイベントが作成されます。 |
| メトリクス収集用に構成されたアクティブなコネクターによりメトリクスが収集される | [true] に設定されているMetrics collectionフラグを持つ各コネクターについて、 モニターによりem_connector_instanceテーブルのlast_kpi_statusフィールドをチェックして、[エラー] のステータスを検出します。 |
| 重要なメトリックインテリジェンスのスケジュール済みジョブが有効 | モニターにより次の重要なスケジュール済みジョブをチェックし、無効になっていないかどうかを検出します。
|
メトリックインテリジェンスのセルフ健全性モニターを有効または無効にする方法の詳細については、「セルフ健全性モニターの設定」を参照してください。