Metrikdaten erkunden

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 2 Minuten Lesedauer
  • Erfahren Sie mehr über die Verwendung von Metrikdaten zum Analysieren von Metrikdaten und Identifizieren von Anomalien.

    Metrikdaten – Übersicht

    Metrikdaten hilft, potenzielle Serviceausfälle zu erkennen und zu vermeiden. Metrikdaten zeigt basierend auf historischen Metrikdaten ein anomales Verhalten von CIs an, das von Ereignissen möglicherweise nicht erfasst wird.

    Metrikdaten – Anwender

    Tabelle : 1. Anwender
    Anwender Beschreibung
    Ereignismanagement-Anwender

    [evt_mgmt_user]

    Kann Warnungen und die zugrunde liegenden Metriken anzeigen.
    Ereignismanagement-Administrator

    [evt_mgmt_admin]

    Kann alle Metrikdefinitionen und Connector-Einstellungen konfigurieren.
    Betreiber

    [evt_mgmt_operator]

    Kann alle Metrikdefinitionen und Connector-Einstellungen anzeigen.

    Metrikdaten – Workflow

    In der folgenden Abbildung werden das Layout und der Datenfluss in der Anwendung Metrikdaten beschrieben.

    Abbildung : 1. Metrikdaten-Pipeline
    Infografik, die den Metric Intelligence-Workflow beschreibt
    1. Datenerfassung: -Agents, Drittanbieter-Connectors und anwenderdefinierte Connectors (REST) erfassen Leistungsdaten von Servern und Infrastrukturkomponenten. Von Agents erfasste Daten werden über WebSocket an MID-Server übergeben, und von Drittanbieter-Connectors und benutzerdefinierten Connectors erfasste Daten werden über den -Connector an MID-Server übergeben.
    2. Datennormalisierung: Rohdaten werden vom Normalizer so formatiert, dass sie für die Metrikbasis lesbar sind.
    3. Datengruppierung: Daten werden vom Batcher gruppiert und an die REST API in der Instanz (Glide) gesendet.
    4. Datenübertragung an Clotho-TSDB: Die REST API verarbeitet Daten und sendet sie an die Clotho-TSDB.
    5. Modellerstellung: Der Trainer/Lerner-Auftrag wird ausgeführt und erstellt ein Modell basierend auf den empfangenen Daten. Beispielsweise kann die Aufgabe erfahren, dass der Schwellenwert für die normale CPU-Auslastung 60 % beträgt. Jeden Tag wird ein neues Modell erstellt, das auf den Daten dieses Tages und früheren Daten basiert (die meisten Modelle sammeln Daten aus den letzten 14 Tagen).
    6. Übertragung von Modelldaten in die Zeitreihenmodell-Cache-DB: Die Daten werden über die Instanz (Glide) an die Zeitreihenmodell-Cache-DB auf dem MID-Server gesendet. Der Modell-Cache speichert die Grenzen des „normalen“ Modells.
    7. Anomalie-Erkennung: Daten außerhalb der Grenzen des Normalwerts werden von MID-Server erkannt und als Anomaliepunktzahl gerendert. Anomalien werden in der Instanz gespeichert und im Service Operations-Arbeitsbereichangezeigt. Die Erkennung von Anomalien wird in Echtzeit durchgeführt, sodass Kunden sofort auf Anomalien aufmerksam gemacht werden.

    Metrikdaten – Vorteile

    Vorteil Funktion Anwender
    Überwachen Sie den Zustand, die Leistung und die Verfügbarkeit Ihres Systems durch die automatisierte Erfassung von Ereignissen und Metriken und nutzen Sie automatisierte Konfigurationen. Agent Client Collector-Überwachung NOC-Operator, Ereignismanagement Administrator
    Reduzieren Sie Rauschen, indem Sie nur die relevantesten Anomalien heraufstufen.

    Zeigen Sie Anomaliewarnungen an

    Metrikregeln erstellen

    Ereignismanagement-Administrator
    Erkennen Sie Anomalien mit der KI-basierten Anomalie-Erkennung, entweder mit der nicht überwachten Erkennung von anomalen Mustern durch maschinelles Lernen (kein Benutzereingriff) oder durch Festlegen deterministischer Warnungsregeln (manuelles Festlegen eines statischen Schwellenwerts). Wie Health Log Analytics Warnungen generiert Ereignismanagement-Administrator
    Verbessern Sie die Lösungszeit offener Warnungen und Incidents mit der Visualisierung von Metrikrohdaten. Metric Explorer NOC-Operator, Ereignismanagement Administrator