Terminologies de base Mesures de fiabilité du site

  • Rversion finale: Xanadu
  • Mis à jour 1 août 2024
  • 1 minute de lecture
  • Un guide rapide de certaines terminologies de base pour comprendre Mesures de fiabilité du site (SRM) et utiliser ses fonctionnalités.

    Tableau 1. Termes utilisés dans SRM
    Conditions Descriptions
    Application Performance Management (APM) Surveillance et gestion des performances et de la disponibilité des applications. APM vise à détecter et à diagnostiquer les problèmes de performance complexes des applications et à maintenir un niveau de service attendu.
    Gestion des niveaux de service (SLM) Cadre de travail selon lequel les niveaux de service sont convenus entre un fournisseur et un consommateur pour prendre en charge les processus business. Gestion des niveaux de service inclut Accord sur les niveaux de service (SLA), Accord de niveau opérationnel (OLA) et Contrat sous-jacent (UC).
    Accords sur les niveaux de service (SLA) Un SLA définit le niveau de service convenu entre un fournisseur et un consommateur. Il expose généralement les mesures utilisées pour mesurer le service, ainsi que les corrections ou les pénalités si les niveaux de service convenus ne sont pas atteints.
    Objectif de niveau de service (SLO) Valeur cible ou plage de valeurs pour un niveau de service mesuré par un SLI.
    Indicateur de niveau de service (SLI) Mesure quantitative de certains aspects du niveau de service fourni. Les mesures sont utilisées pour définir les SLO cibles.
    Fiabilité mesurée Possibilité de fournir les services promis de façon cohérente et précise. La fiabilité est calculée automatiquement en soustrayant les pannes de 100 %.
    Budget d'erreur

    Un budget d'erreur est le montant du SLO que vous pouvez utiliser sur une période spécifiée. Il peut être utilisé pour gérer la vélocité de la mise en production. Il est généralement basé sur la disponibilité, la latence, etc.

    Politique de budget d'erreur Une politique ou une règle créée pour un service afin de déclencher des actions telles que la création d'un incident ou l'envoi de notifications lorsqu'un seuil fixé est atteint.