サービスリライアビリティ管理の詳細

  • リリースバージョン: Australia
  • 更新日 2026年03月12日
  • 所要時間:5分
  • サービスリライアビリティ管理 (SRM) は、チームがサービスヘルスを管理するためのガイド付きセルフサービスエクスペリエンスを提供します。このエクスペリエンスは、サービスオペレーションワークスペースアプリケーションを使用して構築され、ITOM と ITSM の機能を単一のワークフローに統合します。

    SRMの概要

    サイト信頼性エンジニアリング (SRE) プラクティスにより、サービスヘルスを最適化します。SRM は、チームが SRE を使用してデジタルサービスの信頼性を向上できるようになる唯一のオペレーションワークスペースです。
    • オンコールエスカレーションを使用して、問題に適切なタイミングで応答します。
    • ガイド付きセルフサービスでセットアップの手間を軽減して、分散したチームをオンボーディングします。また、分離されたデータを使用し、権限化されたアクセスを提供し、中心となる IT を使用して最小限の管理を行います。

    SRM をインストールすると、いくつかのプラグインやアプリケーションも有効になります。詳細については、「ITOM AIOps とともにインストールされるプラグインまたはアプリケーション」を参照してください。

    SRM ユーザー

    表 : 1. ユーザー
    ユーザー 説明 含まれるロール
    アドミン
    ServiceNow アドミニストレーターは、 ServiceNow プラットフォームを管理、構成、および保守します。SRM では、サービスオペレーションワークスペース アドミンセンターにアクセスして作業できます。アドミンのみが次の操作を実行できます。
    • SRM をインストールします。
    • SRMアドミンを追加および管理します。
    • 統合ユーザーを作成および管理します。
    すべて
    SRM アドミニストレーター [srm_admin]
    注:
    このロールは、ServiceNow アドミンロールとは異なります。

    SRM アドミニストレーターは、アカウント設定、構成、およびユーザーを管理できます。

    アドミニストレーターは、以下のアクションを実行できます。
    • すべての SRM 構成に対するアクセス、作成、編集、または削除。
    • 統合の追加または管理。
    • Application Performance Monitoring (APM) ツールとの統合の作成。
    • 信頼性メトリクスのセットアップと管理。
    • エラー予算ポリシーのセットアップと管理。
    • 管理者
    • レスポンダー
    SRM マネージャー [srm_manager] マネージャーは、SRE チームを監督します。マネージャーは、チームのオンコールスケジュールに SRE をアサインし、パフォーマンスを監視して、インシデントの対処手順とソリューションの開発手順を作成します。マネージャーは、すべてのシステムと DevOps ワークフロー全体におけるレジリエンスを促進します。
    マネージャーは、チームのコンテキスト内で次のアクションを実行できます。
    • チーム、オンコールスケジュール、およびサービスの定義とセットアップ。
    • レスポンダーなどのユーザーや、所属するチームのマネージャーの追加と削除。
    • 統合の追加または管理。
    • Application Performance Monitoring (APM) ツールとの統合の作成。
    • 信頼性メトリクスのセットアップと管理。
    • エラー予算ポリシーのセットアップと管理。
    レスポンダー
    SRM レスポンダー [srm_responder]

    SRM を使用して日常業務を実行するサービス信頼性エンジニア (SRE)。レスポンダーは、オンコールでインシデントを診断および修復します。

    レスポンダーは、自分が属する構成にのみアクセスできます。権限を持つアラートまたはインシデントにのみアクセスできます。

    SRE は、チームのコンテキスト内で次のアクションを実行できます。
    • サービス、チーム、統合のセットアップ。
    • オンコールスケジュールの確認。
    • インシデントとアラートのレコードの管理。
    • 作成したチームの更新。
    • 他のレスポンダーの追加
    • Application Performance Monitoring (APM) ツールとの統合の作成。
    • 信頼性メトリクスのセットアップと管理。
    • エラー予算アクションのセットアップと管理。
    以下を含む 17 のロールを継承します。
    • cmdb_read
    • sn_sow.sow_user
    • sn_sow_srm.srm_responder
    • workspace_user
    • slo_operator

    詳細については、「SRM のロールと責任」を参照してください。

    SRM のワークフロー

    レスポンダー、マネージャー、およびアドミニストレーターが、チームの管理、サービスの登録、SLO の定義、統合の監視、通知への応答、およびインシデントの修復を行う方法を示すインフォグラフィック。詳細については、以下の説明を参照してください。
    1. IT または LOB (基幹業務) の製品チームは 、新しいサービスインスタンスと技術管理サービスの継続的に提供します。例:新規顧客請求ポータル。
    2. SLO 管理に加えて、チームはサービスを登録し、サービスレベル目標 (SLO) を定義して、ビジネス成果の達成を支援できます。例:請求ポータルの月次可用性 95%。
    3. モニタリング統合はチームが設定し、これらのサービスの正常性をリアルタイムに収集します。例:クラウド可観測性。
    4. モニタリングでは、サービスのパフォーマンスが低下している場合に、アラートに影響を与えるサービスレベルインジケーター (SLI) が作成されます。自動化のグループ化と拡張。例:請求ポータルの待機時間が 7 秒を超えている。
    5. アラートが機能停止または顧客に影響を与えるデグレードを示している場合は、インシデントが作成され、オンコール通知が適切なチームリソースに通知されます。例:請求ポータルの遅延の問題は、請求処理 SRE チームに電話で通知される。
    6. チームは、インシデントを共同で診断し、修復した後に、システムのレジリエンス向上のためのアクションアイテムを特定します。例:請求チームは、Web サーバーの容量を追加することを決定した。
    7. 経営陣は、SLO パフォーマンスを継続的にレビューし、エラー予算が尽きたときに変更されないようにし、パフォーマンスの低いサービスの改善イニシアチブを優先させます。

    SRM のメリット

    メリット 機能 ユーザー
    チームベースのエクスペリエンス SRM チームの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    サービス登録 SRM サービスの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    事前に構築された統合 SRMでの統合の操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    サービスヘルスの測定 信頼性メトリクスの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー
    オンコールカバー範囲 SRMオンコールスケジュールの作成 SRM アドミニストレーター、マネージャー、およびレスポンダー
    重大度の高いアラートとインシデントの修復 SRM の信頼性タスクの操作 SRM アドミニストレーター、マネージャー、およびレスポンダー