ヘルスログアナリティクスでのログデータフローの監視と統合設定の最適化
ヘルスログアナリティクス の [概要] 画面には、特定のアクティブな統合のログ処理パイプライン内のコンポーネントの包括的なビューが表示されます。この画面から、この統合のストリーミングの問題をトラブルシューティングし、必要に応じて設定を調整できます。
[概要] 画面には、アクティブな統合のログデータストリーミングステータスとストリーミングソースが表示されます。これにより、[データ入力マッピング]、[ソースタイプ構造]、[ログソース] の各ページ、およびログビューアーに直接アクセスできます。これらはすべて、現在の統合からのコンテキストを使用して行われます。
ストリーミングステータス
ServiceNow AIOps コンポーネントには、HLAエンジンによって作成されたアラートの合計数が表示されます。これらの統計情報は、[ 概要 ] 画面がロードされると更新され、ライブデータを表示するために毎分自動的に更新されます。デフォルトの自動リフレッシュの時間間隔は、システムプロパティ sn_itom_integ_app.overview_page_data_input_stats_auto_refresh_interval_secondsを使用して変更できます。
データストリーミングが失敗した場合、統合は自動的に非アクティブ化され、 ストリーミングステータス はエラーが発生したコンポーネントをマークします。さらに、バナーは障害を説明し、障害を修正するための手順を提案するか、 ServiceNow サポートについて言及します。
Amazon Data Firehose などの MID なし統合または OpenTelemetry Protocol (OTLP) 統合の場合、[概要] 画面には ITOM ゲートウェイがログ処理パイプラインのコンポーネントとして表示されます。ログデータはソースから ITOM Gateway に直接送信されるため、MID サーバー コンポーネントはパイプラインに表示されません。その後、ログは HLA エンジンによって処理され、異常が検出されます。
ログストリーミングソース
| 列 | 説明 |
|---|---|
| 名前 | ログデータソースの名前。 |
| ステータス | ストリーミングステータス:アクティブまたは非アクティブ。 |
| データ入力 | 統合により、データが ServiceNow インスタンスにストリーミングされます。 |
| MID サーバー | ログデータのストリーミング先の MID サーバー 。 |
| 最新イベント時刻 | 統合が最新のイベントを受信した時刻。 |
| 前回のログ処理時刻 | 最後のログが受信または処理された時刻。 |
| 生のログ行数/秒 (Raw log lines/sec) | 過去 1 分間に MID サーバー にストリーミングされた生のログ行の平均数/秒。 注: この値は、前処理前の生のログ行の数を表します。 |
| 前処理済みログ行数/秒 (Preprocessed log lines/sec) | 過去 1 分間に MID サーバー にストリーミングされた前処理済みのログ行の平均数/秒。 注: この値は、1 秒あたりの生のログ行数とは異なる場合があります。たとえば、前処理中にログが削除されたために差異が生じる可能性があります。 |
例
アドミニストレーターは、統合 の概要 ページを使用して、 ServiceNow インスタンスへの継続的なデータフローを確認します。ログストリーミングが失敗した場合、 HLA は例外の検出やアラートの生成に必要なリアルタイムデータを受信できません。
たとえば、アクティブな Elasticsearch 統合の [ストリーミングステータス] には、ログ処理パイプラインの MID サーバー コンポーネントに対して赤い円と白い X が表示される場合があります。これは、ログが MID サーバーに到達していないことを示しています。
ログストリーミングソーステーブルには、「認証に失敗しました」または「接続エラー」のステータスが表示され、無効な認証情報を示すエラーメッセージが表示されます。これは、 Elasticsearch 認証情報に問題があることを示しています。認証情報を修正し、ログサービスを再起動するか、次のポーリングサイクルを待つと、接続が復元されます。
[ ログストリーミングソース ] テーブルに、認証に成功した接続ステータスが [接続済み] または [アクティブ] と表示されるようになりました。[ストリーミングステータス] には、MID サーバーコンポーネントの白いチェックマークが付いた緑色の円が表示されます。ログストリーミングが復元されると、 HLA データの処理と異常アラートの生成を再開できます。