サービスリライアビリティ管理の詳細
サービスリライアビリティ管理 (SRM) は、チームがサービスヘルスを管理するためのガイド付きセルフサービスエクスペリエンスを提供します。このエクスペリエンスは、サービスオペレーションワークスペースアプリケーションを使用して構築され、ITOM と ITSM の機能を単一のワークフローに統合します。
SRMの概要
サイト信頼性エンジニアリング (SRE) プラクティスにより、サービスヘルスを最適化します。SRM は、チームが SRE を使用してデジタルサービスの信頼性を向上できるようになる唯一のオペレーションワークスペースです。
- オンコールエスカレーションを使用して、問題に適切なタイミングで応答します。
- ガイド付きセルフサービスでセットアップの手間を軽減して、分散したチームをオンボーディングします。また、分離されたデータを使用し、権限化されたアクセスを提供し、中心となる IT を使用して最小限の管理を行います。
SRM をインストールすると、いくつかのプラグインやアプリケーションも有効になります。詳細については、「ITOM AIOps とともにインストールされるプラグインまたはアプリケーション」を参照してください。
SRM ユーザー
| ユーザー | 説明 | 含まれるロール |
|---|---|---|
| アドミン |
ServiceNow アドミニストレーターは、 ServiceNow プラットフォームを管理、構成、および保守します。SRM では、サービスオペレーションワークスペース アドミンセンターにアクセスして作業できます。アドミンのみが次の操作を実行できます。
|
すべて |
| SRM アドミニストレーター [srm_admin] 注: このロールは、ServiceNow アドミンロールとは異なります。 |
SRM アドミニストレーターは、アカウント設定、構成、およびユーザーを管理できます。 アドミニストレーターは、以下のアクションを実行できます。
|
|
| SRM マネージャー [srm_manager] | マネージャーは、SRE チームを監督します。マネージャーは、チームのオンコールスケジュールに SRE をアサインし、パフォーマンスを監視して、インシデントの対処手順とソリューションの開発手順を作成します。マネージャーは、すべてのシステムと DevOps ワークフロー全体におけるレジリエンスを促進します。 マネージャーは、チームのコンテキスト内で次のアクションを実行できます。
|
レスポンダー |
| SRM レスポンダー [srm_responder] |
SRM を使用して日常業務を実行するサービス信頼性エンジニア (SRE)。レスポンダーは、オンコールでインシデントを診断および修復します。 レスポンダーは、自分が属する構成にのみアクセスできます。権限を持つアラートまたはインシデントにのみアクセスできます。 SRE は、チームのコンテキスト内で次のアクションを実行できます。
|
以下を含む 17 のロールを継承します。
|
詳細については、「SRM のロールと責任」を参照してください。
SRM のワークフロー
- IT または LOB (基幹業務) の製品チームは 、新しいサービスインスタンスと技術管理サービスの継続的に提供します。例:新規顧客請求ポータル。
- SLO 管理に加えて、チームはサービスを登録し、サービスレベル目標 (SLO) を定義して、ビジネス成果の達成を支援できます。例:請求ポータルの月次可用性 95%。
- モニタリング統合はチームが設定し、これらのサービスの正常性をリアルタイムに収集します。例:クラウド可観測性。
- モニタリングでは、サービスのパフォーマンスが低下している場合に、アラートに影響を与えるサービスレベルインジケーター (SLI) が作成されます。自動化のグループ化と拡張。例:請求ポータルの待機時間が 7 秒を超えている。
- アラートが機能停止または顧客に影響を与えるデグレードを示している場合は、インシデントが作成され、オンコール通知が適切なチームリソースに通知されます。例:請求ポータルの遅延の問題は、請求処理 SRE チームに電話で通知される。
- チームは、インシデントを共同で診断し、修復した後に、システムのレジリエンス向上のためのアクションアイテムを特定します。例:請求チームは、Web サーバーの容量を追加することを決定した。
- 経営陣は、SLO パフォーマンスを継続的にレビューし、エラー予算が尽きたときに変更されないようにし、パフォーマンスの低いサービスの改善イニシアチブを優先させます。
SRM のメリット
| メリット | 機能 | ユーザー |
|---|---|---|
| チームベースのエクスペリエンス | SRM チームの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| サービス登録 | SRM サービスの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| 事前に構築された統合 | SRMでの統合の操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| サービスヘルスの測定 | 信頼性メトリクスの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| オンコールカバー範囲 | SRMオンコールスケジュールの作成 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
| 重大度の高いアラートとインシデントの修復 | SRM の信頼性タスクの操作 | SRM アドミニストレーター、マネージャー、およびレスポンダー |
詳細情報
SRM の構成と使用の詳細については、以下を参照してください。