Service Reliability Management erkunden

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 3 Minuten Lesedauer
  • Service Reliability Management (SRM) bietet Teams eine geführte Selfservice-Experience zur Verwaltung der Serviceintegrität. Die Experience wird mit der Anwendung Service Operations Workspace erstellt und kombiniert ITOM- und ITSM-Funktionen in einem einzigen Workflow.

    SRM – Übersicht

    Optimieren Sie die Serviceintegrität mit Site Reliability Engineering-Methoden (SRE). SRM ist ein einzelner Betriebsarbeitsbereich, mit dem Teams die Zuverlässigkeit digitaler Services mit SRE verbessern können.
    • Mit Rufbereitschaftseskalationen können Sie rechtzeitig auf Probleme reagieren.
    • Reduzieren Sie die Setup-Probleme mit geführtem Self-Service, um verteilte Teams mit getrennten Daten, ermöglichtem Zugriff und minimaler Governance von der zentralen IT einarbeiten zu lassen.

    Wenn SRM installiert ist, werden auch mehrere Plugins und Anwendungen aktiviert. Weitere Informationen finden Sie unter Mit installierte Plugins oder Anwendungen ITOM-Integrität.

    SRM – Anwender

    Tabelle : 1. Anwender
    Anwender Beschreibung Enthält Rollen
    Administrator

    Ein ServiceNow-Administrator ist für Verwaltung, Entwicklung, Betrieb, Schulung und Wartung der ServiceNow Platform verantwortlich.

    Verantwortlich für die Installation und kann die Service Operations-Arbeitsbereich Admin Center-Konfiguration von SRM durchführen.

    Alle
    -Administrator [srm_admin]
    Hinweis:
    Diese Rolle unterscheidet sich von der Administratorrolle ServiceNow.

    SRM-Administratoren können Kontoeinstellungen, Konfigurationen und Benutzer verwalten.

    Administratoren können folgende Aktionen ausführen:
    • Alle SRM-Konfigurationen erstellen, bearbeiten oder löschen und darauf zugreifen.
    • Integrationen hinzufügen oder verwalten.
    • Erstellen Sie Integrationen mit APM-Tools (Application Performance Monitoring) für Anwendungen.
    • Zuverlässigkeitsmetriken einrichten und verwalten.
    • Fehlerbudgetrichtlinien einrichten und verwalten.
    • Manager
    • Beantworter
    -Manager [srm_manager] Manager überwachen ein Team von SREs. Manager weisen dem Rufbereitschaftszeitplan des Teams SREs zu, überwachen ihre Leistung und erstellen Verfahren zur Behandlung von Incidents und zur Entwicklung von Lösungen. -Manager fördern die Resilienz über alle Systeme und DevOps-Workflows hinweg.
    Manager können im Kontext ihrer Teams folgende Aktionen ausführen:
    • Teams, Rufbereitschaftszeitpläne und Services definieren und einrichten.
    • Benutzer wie Beantworter und Manager für die Teams hinzufügen und löschen, denen sie angehören.
    • Integrationen hinzufügen oder verwalten.
    • Erstellen Sie Integrationen mit APM-Tools (Application Performance Monitoring) für Anwendungen.
    • Zuverlässigkeitsmetriken einrichten und verwalten.
    • Fehlerbudgetrichtlinien einrichten und verwalten.
    Beantworter
    Beantworter [srm_responder]

    Ein Service Reliability Engineer (SRE), der SRM zur Ausführung alltäglicher Aufgaben verwendet. Beantworter sind die Personen, die Rufbereitschaft haben und Incidents diagnostizieren und beheben.

    Beantworter können nur auf Konfigurationen zugreifen, denen sie angehören. Sie können nur auf die Warnungen oder Incidents zugreifen, für die sie Berechtigungen haben.

    SREs können im Kontext ihrer Teams folgende Aktionen ausführen:
    • Services, Teams und Integrationen einrichten.
    • Bestätigen Sie die Rufbereitschaftszeitpläne.
    • Verwalten Sie Incident- und Warnungsdatensätze.
    • Die von ihnen erstellten Teams aktualisieren.
    • Weitere Beantworter hinzufügen
    • Erstellen Sie Integrationen mit APM-Tools (Application Performance Monitoring) für Anwendungen.
    • Zuverlässigkeitsmetriken einrichten und verwalten.
    • Fehlerbudgetaktionen einrichten und verwalten.
    Erbt 17 Rollen, darunter die folgenden:
    • cmdb_read
    • sn_sow.sow_user
    • sn_sow_srm.srm_responder
    • workspace_user
    • slo_operator

    Weitere Informationen finden Sie unter SRM Rollen und Zuständigkeiten.

    SRM – Workflow

    Infografik, die zeigt, wie Beantworter, Manager und Administratoren Teams verwalten, Services registrieren, SLO definieren, Integrationen überwachen, auf Benachrichtigungen reagieren und Incidents beheben. Einzelheiten finden Sie in der nachfolgenden Beschreibung.
    1. Produktteams in IT oder Branchen liefern kontinuierlich neue technische und Anwendungsservices. Beispiel: Neues Kundenabrechnungsportal.
    2. Zusammen mit SLO-Managementkönnen Teams Services registrieren und Servicelevel-Ziele (SLOs) definieren, die ihnen beim Erreichen von Geschäftsergebnissen helfen. Beispiel: 95 % monatliche Verfügbarkeit für das Abrechnungsportal.
    3. Überwachungsintegrationen werden von den -Teams eingerichtet, um die Echtzeitintegrität dieser Services zu erfassen. Beispiel: Cloud Observability.
    4. Die Überwachung erstellt Servicelevel-Indikatoren (SLIs), die sich auf Warnungen auswirken, wenn Services unterdurchschnittlich abschneiden. Automatisierungsgruppen und -bereicherungen Beispiel: Die Latenz des Abrechnungsportals überschreitet 7 s.
    5. Wenn die Warnungen auf einen Ausfall oder eine Verschlechterung hinweisen, die sich auf den Kunden auswirkt, werden Incidents erstellt, und die entsprechenden Teamressourcen werden durch Rufbereitschaftsbenachrichtigungen benachrichtigt. Beispiel: Ein SRE-Team für Abrechnungen wird telefonisch über ein Latenzproblem im Abrechnungsportal benachrichtigt.
    6. Nachdem Teams gemeinsam Incidents diagnostizieren und beheben, identifizieren sie Aktionselemente zur Verbesserung der Resilienz des Systems. Beispiel: Das Abrechnungsteam beschließt, zusätzliche Webserverkapazität hinzuzufügen.
    7. Das Management überprüft kontinuierlich die SLO-Leistung, hilft, Changes zu verhindern, wenn das Fehlerbudget ausgeschöpft ist, und priorisiert Verbesserungsinitiativen für unterdurchschnittliche Services.

    SRM – Vorteile

    Vorteil Funktion Anwender
    Teambasierte Experience Mit SRM-Teams arbeiten SRM-Administratoren, Manager und Beantworter
    Serviceregistrierung Mit SRM-Services arbeiten SRM-Administratoren, Manager und Beantworter
    Vorgefertigte Integrationen Mit SRM-Integrationen arbeiten SRM-Administratoren, Manager und Beantworter
    Zum Messen der Serviceintegrität Mit Zuverlässigkeitsmetriken arbeiten SRM-Administratoren, Manager und Beantworter
    Bereitschaftsabdeckung Eigene SRM-Rufbereitschaftspläne erstellen SRM-Administratoren, Manager und Beantworter
    Korrigieren Sie Warnungen und Incidents mit hohem Schweregrad Mit SRM-Zuverlässigkeitsaufgaben arbeiten SRM-Administratoren, Manager und Beantworter