Explorer Gestion de la fiabilité des services

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 4 minutes de lecture
  • Gestion de la fiabilité des services (SRM) fournit une expérience guidée en libre-service aux équipes pour gérer l’intégrité des services. L’expérience est créée à l’aide de l’application Espace de travail pour l’exploitation des services et combine les options ITOM et ITSM en un seul workflow.

    Vue d'ensemble de SRM

    Optimisez l’intégrité du service avec les pratiques SRE (Site Reliability Engineering). SRM est un espace de travail d’opérations unique qui permet aux équipes d’améliorer la fiabilité des services numériques avec SRE.
    • Utilisez les escalades d’astreinte pour répondre aux problèmes en temps opportun.
    • Réduisez les difficultés de configuration grâce au libre-service guidé pour intégrer des équipes distribuées avec des données séparées, un accès habilité et une gouvernance minimale à partir de l’informatique centrale.

    Lorsqu’il SRM est installé, plusieurs modules d’extension et applications sont également activés. Pour plus d'informations, consultez Modules d’extension ou applications installés avec ITOM AIOps.

    SRM utilisateurs

    Tableau 1. Utilisateurs
    Utilisateurs Description Contient des rôles
    administrateur
    ServiceNow Les administrateurs gèrent, configurent et assurent la maintenance de la ServiceNow plateforme. Dans SRM, ils peuvent accéder à l’Admin Espace de travail pour l'exploitation des services Center et y travailler. Seuls les administrateurs peuvent effectuer les actions suivantes :
    • Installez SRM.
    • Ajouter et gérer SRM des administrateurs.
    • Créer et gérer les utilisateurs d’intégration.
    Tous
    Administrateur SRM [srm_admin]
    Remarque :
    Ce rôle diffère du ServiceNow rôle administrateur.

    Les administrateurs SRM peuvent gérer les paramètres, les configurations et les utilisateurs du compte.

    Les administrateurs peuvent effectuer les actions suivantes :
    • Accéder à toutes les configurations SRM, les créer, les modifier ou les supprimer
    • Ajouter des intégrations ou les gérer
    • Créez des intégrations avec des outils de Surveillance de la performance des applications (APM).
    • Configurer et gérer les mesures de fiabilité.
    • Configurer et gérer les politiques de budget d’erreur.
    • Gestionnaire
    • Répondeur
    Gestionnaire SRM [srm_manager] Les gestionnaires supervisent une équipe de SRE. Les gestionnaires affectent les SRE au calendrier d’astreinte de l’équipe, surveillent leurs performances et créent des procédures pour gérer les incidents et développer des solutions. Les gestionnaires favorisent la résilience de tous les systèmes et des workflows DevOps.
    Les gestionnaires peuvent effectuer les actions suivantes dans le contexte de leurs équipes :
    • Définissez et configurez les équipes, les calendriers d’astreinte et les services.
    • Ajouter et supprimer des utilisateurs tels que des intervenants et des gestionnaires pour les équipes dont ils font partie.
    • Ajouter des intégrations ou les gérer
    • Créez des intégrations avec des outils de Surveillance de la performance des applications (APM).
    • Configurer et gérer les mesures de fiabilité.
    • Configurer et gérer les politiques de budget d’erreur.
    Répondeur
    Répondeur SRM [srm_responder]

    Un ingénieur en fiabilité des services (SRE) qui utilise SRM pour effectuer des tâches quotidiennes. Les intervenants sont les personnes qui sont d’astreinte et qui diagnostiquent et corrigent les incidents.

    Les intervenants ne peuvent accéder qu’aux configurations dont ils font partie. Ils ne peuvent accéder qu’aux alertes ou incidents pour lesquels ils disposent d’une autorisation.

    Les SRE peuvent effectuer les actions suivantes dans le contexte de leurs équipes :
    • Configurer des services, des équipes et des intégrations.
    • Confirmer leurs calendriers d’astreinte.
    • Gérez les enregistrements d’incidents et d’alertes.
    • Mettre à jour les équipes qu’ils ont créées.
    • Ajouter d’autres intervenants.
    • Créez des intégrations avec des outils de Surveillance de la performance des applications (APM).
    • Configurer et gérer les mesures de fiabilité.
    • Configurer et gérer les actions de budget d’erreur.
    Hérite de 17 rôles, dont les suivants :
    • cmdb_read
    • sn_sow.sow_user
    • sn_sow_srm.srm_responder
    • workspace_user
    • slo_operator

    Pour plus d'informations, consultez SRM Rôles et responsabilités.

    Workflow SRM

    Infographie montrant comment les intervenants, les gestionnaires et les administrateurs gèrent les équipes, enregistrent les services, définissent les SLO, surveillent les intégrations, répondent aux notifications et corrigent les incidents. Pour en savoir plus, reportez-vous à la description suivante.
    1. Les équipes produit des départements IT ou Business fournissent en permanence de nouvelles instances de service et de nouveaux services de gestion des technologies, . Exemple : nouveau portail de facturation client.
    2. De plus Gestion du SLO, les équipes peuvent enregistrer des services et définir des objectifs de niveau de service (SLO), ce qui les aide à atteindre des résultats commerciaux. Exemple : disponibilité mensuelle de 95 % pour le portail de facturation.
    3. Des intégrations de surveillance sont mises en place par les équipes pour collecter l’intégrité en temps réel de ces services. Exemple : Observabilité du cloud.
    4. Monitoring crée des indicateurs de niveau de service (SLI) qui impactent les alertes lorsque les services sont sous-performants. Groupes d’automatisation et enrichissements. Exemple : la latence du portail de facturation dépasse 7 s.
    5. Lorsque les alertes indiquent une panne ou une dégradation ayant un impact sur le client, des incidents sont créés et des notifications d’astreinte informent les ressources d’équipe appropriées. Exemple : une équipe SRE de facturation est informée par téléphone d’un problème de latence sur le portail de facturation.
    6. Une fois que les équipes ont diagnostiqué et corrigé les incidents de manière collaborative, elles identifient les éléments d’action pour améliorer la résilience du système. Exemple : l’équipe de facturation décide d’ajouter de la capacité de serveur Web supplémentaire.
    7. La direction examine en permanence les performances SLO, aide à prévenir les changements lorsque le budget d’erreur est épuisé et donne la priorité aux initiatives d’amélioration pour les services sous-performants.

    SRM avantages

    Avantage Fonctionnalité Utilisateurs
    Expérience basée sur l’équipe Travailler en équipe SRM Administrateurs, gestionnaires et intervenants SRM
    Inscription au service Travailler avec SRM des services Administrateurs, gestionnaires et intervenants SRM
    Intégrations prédéfinies Travailler avec les intégrations dans SRM Administrateurs, gestionnaires et intervenants SRM
    Mesurer l’intégrité du service Utiliser les mesures de fiabilité Administrateurs, gestionnaires et intervenants SRM
    Couverture d’astreinte Créer un calendrier d’astreinte SRM Administrateurs, gestionnaires et intervenants SRM
    Remédier aux alertes et incidents de gravité élevée SRM Utilisation de tâches de fiabilité Administrateurs, gestionnaires et intervenants SRM