Site Reliability Metrics の操作
Site Reliability Metrics (SRM) 機能を使用して、サービスのサービスレベルインジケーター (SLI)、サービスレベル目標 (SLO)、およびエラー予算ポリシーを定義します。これらの測定基準は、ユーザーとチームがサービスを追跡し、必要に応じて適宜アクションを実行するために役立ちます。
エラー予算と、累積違反およびエラー予算残額を表す図を表示できます。エラー予算ポリシーを作成し、次に示すアクションに関連付けることで、サービスレベル目標のしきい値を超えた時点でトリガーすることもできます。
- メールの送信
- インシデントを作成します。
- Microsoft Teams メッセージングサービスを使用したメッセージの送信
- Slack メッセージングサービスを使用したメッセージの送信
- インシデントの作成とオンコール通知
Site Reliability Operations (SRO) ワークスペースの Site Reliability Metrics (SRM) ビューには、次のセクションが含まれています。
信頼性インジケーター
信頼性インジケーターには、次の詳細が表示されます。
- SLI および SLO の詳細
- Application Performance Monitoring (APM) プロパティ
- 測定された信頼性
- エラー予算
- エラー予算残額
- 累積違反の図示
- エラー予算残額の図示注:また、前の期間での累積違反およびエラー予算残額を表す図も表示できます。このフィールドは、前の期間のデータが利用可能な場合にのみ使用できます。
累積違反に関する最新の情報は、現在の値としてグラフに表示されます。データがキャプチャされた正確な時刻を確認する場合は、現在の値の最後のデータポイントにカーソルを合わせます。図 : 2. 累積違反のグラフ表示
エラー予算ポリシー
エラー予算ポリシーには、次の詳細が表示されます。
- バーンレートやエラー予算残額などのしきい値の詳細
- しきい値に対応するアクション
クエリーベースまたはテクニカルサービスの SLO、SLI、およびエラー予算ポリシーを定義することもできます。
クエリベースまたはテクニカルサービスの詳細については、「テクニカルサービスドメインの管理」を参照してください。