サービスオブザーバビリティ の探索
サービスオブザーバビリティ は、運用チームが複雑で分散した本番システムでインシデントをトリアージおよび管理するのに役立ちます。外部のアプリケーションパフォーマンスモニタリング (APM) システムからのテレメトリと 構成管理データベース (CMDB)内の関連データを組み合わせます。サービスオペレーションワークスペース (SOW) の 1 つのワークフローに両方が表示されます。
サービスオブザーバビリティの概要
サービスオブザーバビリティ 特定のサービスに関連する SOW の健全性メトリクスを表示します。メトリクスは、外部 APM システムから取り込み、 CMDB内の関連する構成アイテムのメトリクスと一緒に表示できます。
- Dynatrace
- New Relic
- MySQL
- PostgreSQL
APM インスタンスを サービスオブザーバビリティ に接続した後、APM データの既存のタグを使用して、 CMDB に登録されているサービスを APM メトリクスにマッピングします。
このデータマッピングを使用すると サービスオブザーバビリティ 、ホストやデータベースなどのサービスに関連付けられた APM エンティティのメトリクスを、関連する CI からの情報とともに 1 つの場所に表示できます。オペレーターは、APM メトリクス、関連する CI 情報、およびサービスに関連する現在のインシデントやアラートなどの有用なコンテキスト情報を使用して、サービスの健全性を把握します。
たとえば、 Dynatrace を使用して チェックアウト サービスを監視し、データベースとホストのメトリクスがタグ checkout-service を使用してそのサービスからの要求を示すとします。チェックアウトサービス CI を checkout-service でタグ付けされた APM データにマッピングすることで、サービスオブザーバビリティサービスに関連するデータベース、ホスト、および CI のメトリクスを取得し、それらを一緒に表示します。オペレーターは、 SOWを離れることなく、サービスに関連するエンティティの問題を特定し、緩和プロセスを絞り込むことができます。
サービスオブザーバビリティ ユーザー
| ユーザー | 説明 |
|---|---|
| システム管理者 | システムアドミニストレーターは、ユーザーとチームを構成し、監視対象のサービスを登録し、 サービスオブザーバビリティ APM に接続して、それらのサービスをそのデータにマッピングします。また、 SOW |
| アドミン | サービスオブザーバビリティ アドミニストレーターは、監視対象の単一のサービスを登録できます。また、 SOW内のデータを表示することもできます。 |
| オペレーター/運用マネージャー | オペレーターは、SOW内のインシデントをトリアージするときにサービスオブザーバビリティを使用します。サービスの基本的な健全性メトリクスに加えて、関連するインシデント、アラート、変更を表示できます。[ 観測可能性 ] タブに移動して、ホストやデータベースなどの関連エンティティからのメトリクスとともに追加のサービスメトリクスを表示することで、より詳細な情報を取得できます。 |
サービスオブザーバビリティ のワークフロー
アドミニストレーターは、サービスを登録し、APM メトリクスを接続し、サービスをそのデータにマッピングすることで、 サービスオブザーバビリティ を構成します。オペレーターは サービスオブザーバビリティ を使用して、別の関連エンティティがサービスのパフォーマンスによって表面化した問題を引き起こしているかどうかを判断します。
システムアドミニストレーターは次のことを行います。
- 事業上の重要度に基づいて サービスオブザーバビリティ 監視するサービスを決定し、それらのサービスを登録します。
- 既存の APM インスタンスを サービスオブザーバビリティ に接続します。
- そのデータで使用されている APM ベースのタグに基づいて、登録済みサービスを APM メトリクスデータにマッピングします。
オペレーターまたはマネージャーは、次のことを行います。
- SOWでの作業中に、アラート、サービスダッシュボード、Express Listなどからサービスに関する問題を特定し、[サービスの詳細] ページに移動します。
- サービスの全体的な健全性メトリクスを、関連するインシデント、アラート、変更とともに表示します。メトリクスの 1 つが異常であると思われる場合は、[観測可能性] タブに移動します。
- より詳細なサービスメトリクスと関連エンティティからの情報を表示して、根本原因の調査を開始します。問題がシステムのスタックのさらに下にあることがわかった場合は、そのエンティティの所有権を特定して修復を開始します。
サービスオブザーバビリティ のメリット
| メリット | 機能 | ユーザー |
|---|---|---|
重要な信号とブリッジワークフローを一元化して、俊敏性と信頼性を向上させます。
|
. | 管理 |
| サービスに関連付けられたエンティティの複合メトリクスを表示して、発生半径とインシデントの所有権を判断することで、効率を高め、平均解決時間 (MTTR) を短縮します。 | サービスヘルスメトリクスの表示 | 演算子 |
| システムに関連する変更と、サービスに関連付けられたアラートを 1 か所で確認できます。 | 全体的なサービス健全性の表示. | 演算子 |