Utiliser les mesures de fiabilité
Découvrez les mesures et fonctionnalités de fiabilité qui peuvent vous aider à suivre l’intégrité des services, à répondre aux problèmes et à soutenir vos objectifs business.
Tableau de bord de la fiabilité des services
Le tableau de bord de fiabilité des services affiche une vue personnalisable et de haut niveau des performances de service. Elle vous aide à surveiller et à gérer la fiabilité à l’aide de visualisations qui suivent les états de service, les budgets d’erreur et les objectifs de niveau de service (SLO) au fil du temps.
Le tableau de bord affiche des informations sur tous les services dans Gestion de la fiabilité des services (SRM). Vous pouvez accéder au tableau de bord de l’une Espace de travail pour l'exploitation des services des manières suivantes :
- Accédez à la .
- Accédez à la
Destinations des notifications
Les destinations de notification permettent de tenir les équipes informées sur la fiabilité du service. Joignez-les aux politiques de budget d’erreur pour envoyer des notifications en cas de violation d’une politique.
Pour afficher et gérer les destinations de notification dans Espace de travail pour l'exploitation des services, accédez à .
Consultez les liens suivants pour en savoir plus sur la création et l’utilisation des destinations de notification :
Onglet Mesures de fiabilité
L’onglet Mesures de fiabilité indique dans quelle mesure un service spécifique atteint ses objectifs de fiabilité. Utilisez-le pour suivre les SLO, les indicateurs de niveau de service (SLI) et les budgets d’erreur d’un service.
Pour afficher l’onglet Mesures de fiabilité dans Espace de travail pour l'exploitation des services, accédez à .
Consultez ces liens pour en savoir plus sur ce que vous pouvez faire dans l’onglet Mesures de fiabilité :
Table des objectifs de niveau de service
Dans l’onglet Mesures de fiabilité, la table Objectifs de niveau de service inclut les détails suivants sur les SLO de service :
- Nom : nom du SLO. Vous pouvez sélectionner le nom pour afficher l’enregistrement SLO.
- Fiabilité : état actuel du SLO. Par exemple, stable, en danger ou critique.
- % budget d’erreur restant : pourcentage du budget d’erreur encore disponible pour la période de conformité actuelle.
- Période de conformité : intervalle de temps utilisé pour calculer les performances :
- Mois : mois en cours, par exemple, si la date actuelle est le 26 janvier, le mois va du 1er janvier au 31 janvier.
- 7, 30 ou 90 jours roulants : nombre de jours à partir de la date actuelle. Par exemple, pour 7 jours roulants, la durée est de 7 jours à partir de la date actuelle.
- Type de SLI : catégorie de performance mesurée :
- Disponibilité : pourcentage de temps pendant lequel votre service ou votre élément de configuration est disponible, également connu sous le nom de durée d’activité.
- Erreurs : fréquence de vos erreurs de service.
- Latence : temps nécessaire pour traiter une demande.
- Saturation : plénitude de votre système, en se concentrant sur l’utilisation des ressources.
- Type de source : origine des données utilisées pour calculer les SLI pour ce SLO :
- Alerte : utilise les alertes provenant d’outils de surveillance intégrés.
- Panne : utilise les pannes détectées par les outils de surveillance et signalées par les utilisateurs. Une panne indique quand le service n’était pas disponible. Ce type de source exclut les pannes planifiées, telles que la maintenance planifiée.
- Mis à jour : la date et l’heure de la dernière modification du SLO.
- Mis à jour par : nom d’utilisateur de la personne qui a modifié le SLO pour la dernière fois.
- État : état du SLO. Par exemple, en cours d’exécution ou hors service.