Service-Beobachtbarkeit erkunden
Service-Beobachtbarkeit unterstützt Betriebsteams bei der Selektierung und Verwaltung von Incidents in einem komplexen und verteilten Produktionssystem. Es kombiniert Telemetriedaten aus externen APM-Systemen (Application Performance Monitoring) mit zugehörigen Daten in Configuration Management Database (CMDB). Beide werden in einem einzigen Workflow in Service Operations-Arbeitsbereich (SOW) angezeigt.
Service-Beobachtbarkeit – Übersicht
Service-Beobachtbarkeit zeigt Integritätsmetriken in SOW an, die sich auf einen bestimmten Service beziehen. Metriken können aus einem externen APM-System erfasst und neben Metriken für zugehörige Configuration Items im CMDBangezeigt werden.
- Dynatrace
- New Relic
- MySQL
- PostgreSQL
Nachdem Sie eine APM-Instanz mit Service-Beobachtbarkeitverbunden haben, ordnen Sie die in CMDB registrierten Services den APM-Metriken zu, indem Sie vorhandene Tags in den APM-Daten verwenden.
Mit dieser Datenzuordnung kann Service-Beobachtbarkeit Metriken von APM-Entitäten, die Ihrem Service zugeordnet sind, z. B. einem Host oder einer Datenbank, zusammen mit Informationen aus zugehörigen CIs an einem Ort anzeigen. Um die Integrität des Service zu verstehen, verwenden Operatoren die APM-Metriken, zugehörige CI-Informationen und hilfreiche Kontextinformationen wie aktuelle Incidents und Warnungen im Zusammenhang mit dem Service.
Angenommen, Sie verwenden Dynatrace, um Ihren Checkout- Service zu überwachen, und Metriken aus Ihrer Datenbank und Ihrem Host verwenden das Tag checkout-service, um Anforderungen zu kennzeichnen, die von diesem Service stammen. Durch Zuordnung des Checkout -Service-CI zu den APM-Daten, die mit dem Checkout-Service-Tagmarkiert sind, ruft Service-Beobachtbarkeit Metriken für die Datenbanken und Hosts sowie die CIs ab, die sich auf den Service beziehen, und zeigt sie dann zusammen an. Operatoren können Probleme bei Entitäten im Zusammenhang mit dem Service lokalisieren und den Risikominderungsprozess eingrenzen, ohne den SOWverlassen zu müssen.
Service-Beobachtbarkeit Anwender
| Anwender | Beschreibung |
|---|---|
| Systemadministrator | Systemadministratoren konfigurieren Benutzer und Teams, registrieren zu überwachende Services, verbinden Service-Beobachtbarkeit mit APMs und ordnen diese Services dann den Daten zu. Sie können die Daten auch im anzeigen SOW |
| Administrator | Service-Beobachtbarkeit -Administratoren können einzelne zu überwachende Services registrieren. Sie können auch die Daten im SOWanzeigen. |
| Betreiber/Betriebsleiter | -Operatoren verwenden Service-Beobachtbarkeit für die Selektierung von Incidents im SOW. Sie können grundlegende Integritätsmetriken für einen Service zusammen mit zugehörigen Incidents, Warnungen und Changes anzeigen. Ausführliche Informationen erhalten sie, indem sie zur Registerkarte Erkennbarkeit navigieren, um zusätzliche Servicemetriken zusammen mit Metriken zugehöriger Entitäten wie einem Host oder einer Datenbank anzuzeigen. |
Service-Beobachtbarkeit – Workflow
Administratoren konfigurieren Service-Beobachtbarkeit, indem sie Services registrieren, APM-Metriken verbinden und die Services dann diesen Daten zuordnen. Mit Service-Beobachtbarkeit können Operatoren ermitteln, ob eine andere zugehörige Entität Probleme verursacht, die durch die Leistung des Service zu Tage getreten sind.
Als Systemadministrator:
- Bestimmen Sie die von Service-Beobachtbarkeit zu überwachenden Services basierend auf der Geschäftskritikalität, und registrieren Sie diese Services dann.
- Verbinden Sie vorhandene APM-Instanzen mit Service-Beobachtbarkeit.
- Ordnen Sie registrierte Services APM-Metrikdaten basierend auf APM-basierten Tags zu, die für diese Daten verwendet werden.
Als Operator oder Manager:
- Erkennen Sie ein Problem mit einem Service während der Arbeit in SOW, z. B. anhand einer Warnung, des Service-Dashboards oder Express-Liste, und navigieren Sie dann zur Seite „Servicedetails“.
- Zeigen Sie allgemeine Integritätsmetriken für den Service zusammen mit zugehörigen Incidents, Warnungen und Changes an. Wenn eine der Metriken fehlerhaft erscheint, navigieren Sie zur Registerkarte Erkennbarkeit.
- Zeigen Sie detailliertere Servicemetriken sowie Informationen von zugehörigen Entitäten an, um die Untersuchung der Ursache zu starten. Wenn Sie feststellen, dass das Problem weiter unten im Stapel des Systems liegt, identifizieren Sie den Besitz für diese Entität, um die Korrektur zu starten.
Service-Beobachtbarkeit – Vorteile
| Vorteil | Funktion | Anwender |
|---|---|---|
Zentralisieren Sie kritische Signale und überbrücken Sie Workflows, um Agilität und Zuverlässigkeit zu erhöhen:
|
. | Administratoren |
| Steigern Sie die Effizienz und verkürzen Sie die durchschnittliche Zeit bis zur Lösung (Mean Time to Resolution, MTTR), indem Sie kombinierte Metriken von Entitäten anzeigen, die einem Service zugeordnet sind, um den Blast-Radius und die Verantwortlichkeit für einen Incident zu bestimmen. | Zeigen Sie Serviceintegritätsmetriken an | Operatoren |
| Zeigen Sie an einem Ort zugehörige Änderungen am System und Warnungen an, die einem Service zugeordnet sind. | Zeigen Sie die allgemeine Serviceintegrität an. | Operatoren |