Prozess für Management schwerwiegender Incidents in Service Operations-Arbeitsbereich

  • Freigeben Version: Xanadu
  • Aktualisiert 1. August 2024
  • 3 Minuten Lesedauer
  • Ein schwerwiegender Incident ist ein Incident mit hoher Auswirkung und hoher Dringlichkeit, der eine große Anzahl von Anwendern betrifft und dem Unternehmen einen oder mehrere wichtige Services vorenthält. Aufgrund der Dringlichkeit der Lage ist eine gut koordinierte Reaktion erforderlich, um die Lösung zu beschleunigen und die geschäftliche Beeinträchtigung zu minimieren.

    Bei der Reaktion auf schwerwiegende Incidents ist ein effektives und effizientes System erforderlich, um die hohen Auswirkungen in Form von Serviceunterbrechungen zu minimieren. Ein effizientes System umfasst die folgenden Aktionen:
    • Die Auswirkungen von Serviceunterbrechungen möglichst gering halten.
    • Sicherstellen, dass ein geeigneter Incident-Manager, ein Team für schwerwiegende Incidents oder eine Managementgruppe vorhanden ist, um einen schwerwiegenden Incident zu verwalten.
    • Mit Stakeholdern über Serviceunterbrechungen, Verschlechterungen, Lösungen und andere Aktualisierungen schwerwiegender Incidents kommunizieren.
    • Mit Stakeholdern zusammenarbeiten, um schwerwiegende Incidents zu lösen und den Service wiederherzustellen.
    • Problemdatensatz erstellen, um die Ursache zu analysieren.
    • Nachfolgebericht zum Incident (PIR, Post Incident Report) generieren, um jeden schwerwiegenden Incident zu überprüfen, sobald der Service wiederhergestellt ist.

    Der Prozess für Management schwerwiegender Incidents lässt sich in die folgenden Phasen unterteilen.

    Identifizierung und -Erkennung eines Schwerwiegender Incident
    Die erste Phase des Prozesses besteht in der Identifikation eines potenziellen Kandidaten für einen schwerwiegenden Incident. Schwerwiegende Incidents können Sie wie folgt erkennen und identifizieren:
    • Ein Incident wird basierend auf den konfigurierten Auslöserregeln für schwerwiegende Incidents erkannt und entweder als Kandidat für einen schwerwiegenden Incident vorgeschlagen oder automatisch direkt zu einem schwerwiegenden Incident heraufgestuft.
    • Ein Service Desk-Mitarbeiter überprüft die Incident-Informationen, um festzustellen, ob der Incident als Kandidat für einen schwerwiegenden Incident vorgeschlagen werden soll. Bei einem derartigen Vorschlag prüft eine Manager schwerwiegender Incidents die Informationen des Kandidaten für einen schwerwiegenden Incident und stuft ihn zu einem schwerwiegenden Incident hoch.
    • Ein Manager schwerwiegender Incidents erstellt einen schwerwiegenden Incident direkt ohne den Vorschlagsprozess.
    Kommunikation und Zusammenarbeit
    Die zweite Phase ist die Kommunikation. Gute Kommunikation ist bei schwerwiegenden Incidents unerlässlich, um sicherzustellen, dass IT-Teams, Stakeholder, und Endanwender über Auswirkungen und Fortschritt des schwerwiegenden Incident informiert sind.

    Die Kommunikation während eines schwerwiegenden Incident erfordert einen umfassenden Kommunikationsplan, einschließlich Kontaktpersonen, Methoden und Häufigkeit der Kommunikation sowie der zur Unterstützung verwendeten Messaging-Kanäle wie E-Mail und SMS. Ein Kommunikationsplan ermöglicht dem Team, das für die Reaktion auf Incidents zuständig ist, sich auf die Lösung zu konzentrieren, und definiert die Erwartungen an zukünftige Mitteilungen.

    Sie können einen oder mehrere Kommunikationspläne nach Typ, Incident-Priorität oder Zielgruppe des schwerwiegenden Incident erstellen. Während des gesamten Lebenszyklus des schwerwiegenden Incident werden Benachrichtigungen und Statusaktualisierungen an die Beteiligten gesendet, um sie auf dem Laufenden zu halten und einzubeziehen.

    Neben Kommunikation ist für die Lösung schwerwiegender Incidents auch eine effektive Zusammenarbeit mit IT-Teams und anderen Stakeholdern wichtig. Sie können Kommunikationskanäle wie Microsoft Teams-Telefonkonferenzen verwenden, um bei der Lösung von Problemen zusammenzuarbeiten. Die Seite „Incident-Datensatz“ in Service Operations-Arbeitsbereich bietet verschiedene Steuerungen für die Zusammenarbeit. Weitere Informationen finden Sie unter Zusammenarbeit mit Stakeholdern bei schwerwiegenden Incidents.

    Lösung
    Die nächste Phase im Lebenszyklus eines schwerwiegenden Incident ist seine Lösung. Diese umfasst auch die Lösung aller verknüpften untergeordneten Incidents, und die einzelnen Anrufer werden benachrichtigt, dass der Incident gelöst wurde.
    Problemdatensatz erstellen
    Um die Ursache des schwerwiegenden Incident zu analysieren, muss ein Problemdatensatz erstellt werden. Sie können den Flow Problem aus schwerwiegendem Incident erstellen so konfigurieren, dass ein Problemdatensatz automatisch erstellt wird, nachdem ein schwerwiegender Incident gelöst wurde, oder Sie können den Problemdatensatz manuell erstellen. Sie können auch konfigurieren, dass die Informationen zu schwerwiegenden Incidents automatisch in einen Problemdatensatz kopiert werden, wenn dieser erstellt wird.
    PIR anzeigen
    Die letzte Phase des Lebenszyklus eines schwerwiegenden Incident besteht darin, den Nachfolgebericht zum Incident (PIR) zu generieren. Nachdem der schwerwiegende Incident gelöst wurde, wird ein PIR generiert. Im PIR können Sie den Incident analysieren und nachvollziehen, wie sich ähnliche Incidents in Zukunft vermeiden lassen. Diese Überprüfung bietet auch eine Möglichkeit, den Reaktionsprozess bei Incidents auszuwerten und Bereiche mit Verbesserungspotenzial zu identifizieren. Der Bericht enthält eine Zeitleiste der Ereignisse, die nach der Erstellung eines Incident aufgetreten sind. Während der Überprüfung können Sie den Nachfolgebericht zum Incident anzeigen und aktualisieren, bevor er an Stakeholder weitergegeben wird.