サービスオブザーバビリティ の探索
サービスオブザーバビリティ は、運用チームが複雑で分散した本番システムでインシデントをトリアージおよび管理するのに役立ちます。外部オブザーバビリティモニタリングシステムのテレメトリと 構成管理データベース (CMDB) からの関連データを組み合わせ、両方を サービスオペレーションワークスペース (SOW) の単一のワークフローに表示します。
サービスオブザーバビリティの概要
サービスオブザーバビリティ特定のサービスに関連するSOWのアプリケーション、インフラストラクチャ、およびネットワークの健全性メトリクスを表示します。メトリクスは、外部のオブザーバビリティベンダー (アプリケーション、ネットワーク、およびクラウドモニター) から取り込み、 CMDB内の関連する構成アイテムの情報とともに表示できます。
サービスオブザーバビリティ は、次のオブザーバビリティベンダーをサポートしています。
- Amazon CloudWatch
- AppDynamics
- Cisco ThousandEyes 合成テスト
- Datadog
- DynatraceSaaS とオンプレミス (クラシック環境と Grail 環境の両方)
- LogicMonitor
- Microsoft Azure モニター
- New Relic
- Prometheus オンプレミス
- SolarWinds オンプレミス
- SplunkSplunk Enterprise からの観測可能性とログ
- Zabbix オンプレミス
- MySQL
- PostgreSQL ( Splunk ではサポートされていません)
- 向け RDS (リレーショナルデータベースサービス) Amazon CloudWatch
オブザーバビリティベンダーを サービスオブザーバビリティに接続した後、既存のタグを使用して、 CMDB 内のサービスをオブザーバビリティメトリクスにマッピングします。
たとえば、 Dynatrace を使用して チェックアウト サービス、データベース、およびホストを監視し、これらすべてのエンティティのメトリクスがタグ checkout-service を使用して、そのサービスからの要求を示すとします。チェックアウトサービス CI を checkout-service でタグ付けされたDynatraceデータにマッピングすることで、サービスオブザーバビリティ はサービスに関連するそれらのデータベース、ホスト、および CI のメトリクスを取得し、それらをまとめて表示します。オペレーターは、SOW を離れることなく、サービスに関連するエンティティの問題を特定し、軽減プロセスを絞り込むことができます。
サービスオブザーバビリティ ユーザー
| ユーザー | 説明 |
|---|---|
| システム管理者 |
バージョン 1.5 のみ。 システムアドミニストレーターは、ユーザーとチームを構成し、監視するサービスを登録し、 サービスオブザーバビリティ オブザーバビリティベンダーに接続して、それらのサービスをそのデータにマッピングします。また、 SOW |
| サービスオブザーバビリティ アドミン | バージョン 1.6.x 以降。 サービスオブザーバビリティ アドミニストレーターは、ユーザーとチームを構成し、 サービスオブザーバビリティ オブザーバビリティベンダーに接続して、サービスをそのデータにマッピングできます。また、 SOW内のデータを表示することもできます。アドミニストレーターは、メトリクスと関連情報の表示に使用するダッシュボードテンプレートをカスタマイズすることもできます。 |
| オペレーター/運用マネージャー 注: すべてのデータを表示するには、これらのユーザーが SRM グループタイプに属している必要があります。 |
オペレーターは、SOW内のインシデントをトリアージするときにサービスオブザーバビリティを使用します。関連するインシデント、アラート、変更とともに、サービスの基本的な健全性メトリクスを表示できます。[ オブザーバビリティ] タブに移動して、ホスト、 ネットワーク、 データベースなどの関連エンティティのメトリクスとともに追加のサービスメトリクスを表示することで、より詳細な情報を取得できます。 |
サービスオブザーバビリティワークフロー
アドミニストレーターは、オブザーバビリティベンダーへの接続を作成し、CI サービスをそのデータにマッピングすることで、 サービスオブザーバビリティ を構成します。オペレーターは サービスオブザーバビリティ を使用して、別の関連エンティティがサービスのパフォーマンスによって表面化した問題を引き起こしているかどうかを判断します。
アドミニストレーターは次のことを行います。
- 事業上の重要度に基づいて、 サービスオブザーバビリティ で監視するサービスを決定します。
- 既存のオブザーバビリティベンダーインスタンスを サービスオブザーバビリティに接続します。
- データに添付されたベンダーベースのタグを使用して、サービスをオブザーバビリティメトリクスデータにマッピングします。
- メトリクスのグラフの表示に使用するテンプレートをカスタマイズします。
オペレーターまたはマネージャーは、次のことを行います。
- アラート、サービスダッシュボード、エクスプレスリスト などから、SOW での作業中にサービスの問題を特定し、[サービスの詳細] ページに移動します。
- 関連インシデント、アラート、変更とともに、サービスの全体的な健全性メトリクスを表示します。メトリクスの 1 つが異常と思われる場合は、[オブザーバビリティ (Observability)] タブに移動します。
- より詳細なサービスメトリクスと関連エンティティの情報を表示して、根本原因の調査を開始します。問題がシステムのスタックのさらに下にあると判明した場合、そのエンティティの所有権を識別して修正を開始します。
サービスオブザーバビリティ のメリット
| メリット | 機能 | ユーザー |
|---|---|---|
既存のモニタリングツール、ネットワーク健全性ツール、クラウドプロバイダー、ServiceNow エージェント、サードパーティツールからのデータを統合して、サービスヘルスのフルスタックビューを実現します。
|
。 | アドミン |
| 効率を高め、平均解決時間 (MTTR) を短縮します。サービスに関連付けられたエンティティから結合されたメトリクスを表示して、インシデントの爆発半径と所有権の判断を開始します。 | サービスヘルスメトリクスの表示 | 演算子 |
| サービスに関連付けられたシステムとアラートに関する変更を 1 か所で確認できます。 | 全体的なサービスヘルスを表示する。 | 演算子 |
| 生成 AI を使用してメトリクスデータを分析し、サービスヘルスの判断に役立つインサイトを見つけます。 | 演算子 | |
| インシデント管理ワークフローの一部としてサービスオブザーバビリティデータを表示する | 演算子 | |
| ダッシュボードテンプレートをカスタマイズします。 | サービスオブザーバビリティダッシュボードテンプレートのカスタマイズ | 管理 |