Intégration de Datage dans SR Ops

  • Rversion finale: Xanadu
  • Mis à jour 1 août 2024
  • 2 minutes de lecture
  • Datadog est un service de surveillance d'application et de cloud populaire. Datadog offre un aperçu des mesures granulaires des piles entières, du niveau de l'application aux hôtes réels et aux machines virtuelles. Datadog fournit des alertes basées sur les mesures de surveillance ou les événements liés aux services. Datadog génère des alertes pour les problèmes détectés et SR Ops s'assure que les bonnes personnes travaillent dessus.

    Concernant les règles d'alerte portant sur une valeur de mesure, une règle d'alerte devient active et envoie une notification lorsque la valeur d'une mesure spécifiée dépasse un seuil affecté. Quant aux règles d'alerte sur les événements, une règle peut envoyer une notification sur chaque événement, ou uniquement lorsqu'un certain nombre d'événements se produit.

    Qu'est-ce que SR Ops offre aux utilisateurs Datadog ?

    SR Ops possède une intégration bidirectionnelle native et puissante à Datadog. Utilisez l'intégration pour synchroniser automatiquement vos alertes Datadog avec les alertes SR Ops, et bénéficiez du système enrichi de notifications d'alerte, d'escalades et de rotations d'astreinte de SR Ops. Datadog génère des alertes basées sur les mesures et les événements. SR Ops agit en tant que répartiteur des alertes générées par Datadog. SR Ops identifie les personnes à notifier en fonction des calendriers d'astreinte et des escalades, et envoie les notifications par e-mail, messages texte (SMS), appels téléphoniques et notifications push Android et iOS.
    • Datadog déclenche une alerte lorsqu'une condition définie est remplie. Lorsqu'une alerte est créée dans Datadog, une alerte est automatiquement créée dans SR Ops via l'intégration.
    • Lorsqu'une alerte est reconnue dans SR Ops, elle est également reconnue automatiquement dans Datadog.
    • Lorsqu'une alerte est fermée dans SR Ops, elle est également fermée automatiquement dans Datadog.
    • Lorsqu'une alerte est créée dans SR Ops depuis une source (autre que Datadog), SR Ops peut publier l'alerte dans Datadog (facultatif).
    • Reconnaissez (ou fermez) les alertes dans Datadog.
    • Notifiez les répondeurs d'astreinte en fonction des alertes envoyées par Datadog.
    • Envoyez des données d'événement enrichies depuis Datadog en incluant des visualisations de la mesure/de l'indicateur au niveau du service (SLI) qui a déclenché l'événement.
    • Créez des incidents d'urgence élevée et basse en fonction de la gravité de l'événement à partir de la payload de l'événement Datadog.
    • Les incidents et les escalades sont synchronisés dans SR Ops et Datadog au fur et à mesure des mises à jour.
    • Lorsque la mesure revient à la normale dans Datadog, les incidents sont automatiquement résolus dans SR Ops grâce à la synchronisation bidirectionnelle.

    Fonctionnalité de l'intégration

    Lorsqu'une alerte est créée dans Datadog, une alerte est automatiquement créée dans SR Ops via l'intégration.

    Les mesures Datadog se situant en dehors d'une plage donnée envoient un événement à un service dans SR Ops. Les événements Datadog déclenchent un nouvel incident dans le service SR Ops correspondant, ou se regroupent sous forme d'alertes dans un incident existant.

    Une fois que la mesure est revenue dans la plage désignée, un événement de résolution est envoyé au service SR Ops pour résoudre l'alerte et l'incident associé dans ce service.