Integration von Datadog mit SR Ops

  • Freigeben Version: Xanadu
  • Aktualisiert 1. August 2024
  • 2 Minuten Lesedauer
  • Datadog ist ein beliebter Cloud- und Anwendungsüberwachungsservice. Mit Datadog erhalten Sie Einblicke in granulare Metriken von ganzen Stapeln, von der Anwendungsebene bis zu tatsächlichen Hosts und VMs. Datadog stellt Warnungen basierend auf Überwachungsmetriken für Services oder Ereignissen in Services bereit. Datadog generiert Warnungen für erkannte Probleme, und SR Ops stellt sicher, dass sich die richtigen Mitarbeiter um die Probleme kümmern.

    Wenn bei einer Warnungsregel für einen Metrikwert der Wert einer festgelegten Metrik einen zugewiesenen Schwellenwert überschreitet, wird die Warnungsregel aktiv, und es wird eine Benachrichtigung gesendet. Bei einer Warnungsregel für Ereignisse kann festgelegt werden, ob eine Benachrichtigung für jedes Ereignis oder nur bei Erreichen einer bestimmten Anzahl von Ereignissen gesendet wird.

    Vorteile von SR Ops für Benutzer von Datadog

    SR Ops bietet eine native, leistungsstarke bidirektionale Integration mit Datadog. Nutzen Sie die Integration, um Datadog-Warnungen automatisch mit SR Ops-Warnungen zu synchronisieren, und profitieren Sie vom umfassenden Warnungsbenachrichtigungssystem, den Eskalationen und den Rufbereitschaftsrotationen von SR Ops. Datadog generiert Warnungen basierend auf Metriken und Ereignissen. SR Ops wird für die Zuteilung der von Datadog generierten Warnungen eingesetzt. SR Ops bestimmt die richtigen Personen, die basierend auf Rufbereitschaftszeitplänen und Eskalationsregeln zu benachrichtigen sind, und benachrichtigt sie per E-Mail, Textnachricht (SMS), Telefonanruf sowie per Push-Benachrichtigung auf Android- und iOS-Geräte.
    • Wenn eine definierte Bedingung erfüllt ist, löst Datadog eine Warnung aus. Wenn in Datadog eine Warnung erstellt wird, wird durch die Integration automatisch auch eine Warnung in SR Ops erstellt.
    • Wird die Warnung in SR Ops bestätigt, wird sie auch automatisch in Datadog bestätigt.
    • Wenn die Warnung in SR Ops geschlossen wird, wird sie auch in Datadog automatisch geschlossen.
    • Wenn in SR Ops eine Warnung aus einer beliebigen Quelle (außer Datadog) erstellt wird, kann die Warnung von SR Ops in Datadog veröffentlicht werden (optional).
    • Bestätigen (oder schließen) Sie die Warnungen aus Datadog.
    • Benachrichtigen Sie Mitarbeiter in Rufbereitschaft basierend auf von Datadog gesendeten Warnungen.
    • Senden Sie angereicherte Ereignisdaten aus Datadog, einschließlich Visualisierungen der Metriken oder Servicelevel-Indikatoren (SLI), von denen das Ereignis ausgelöst wurde.
    • Erstellen Sie Incidents mit hoher und niedriger Dringlichkeit basierend auf dem Schweregrad des Ereignisses aus der Nutzlast des Datadog-Ereignisses.
    • Wenn Incidents und Eskalationen aktualisiert werden, werden sie in SR Ops und Datadog synchronisiert.
    • Incidents werden in SR Ops automatisch gelöst, wenn die Metrik in Datadog nach bidirektionaler Synchronisierung wieder normal ist.

    Funktionsweise der Integration

    Wenn in Datadog eine Warnung erstellt wird, wird durch die Integration automatisch auch eine Warnung in SR Ops erstellt.

    Wenn Datadog-Metriken außerhalb eines festgelegten Bereichs liegen, wird ein Ereignis an einen Service in SR Ops gesendet. Durch Ereignisse aus Datadog wird ein neuer Incident im entsprechenden SR Ops-Service ausgelöst, oder die Ereignisse werden als Warnungen in einen vorhandenen Incident eingruppiert.

    Sobald die Metrik wieder im festgelegten Bereich liegt, wird ein resolve-Ereignis an den SR Ops-Service gesendet, und die Warnung und der zugehörige Incident für diesen Service werden gelöst.