Management schwerwiegender Incidents Prozess

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 2 Minuten Lesedauer
  • Ein schwerwiegender Incident ist ein Incident mit höchster Auswirkung und höchster Dringlichkeit, der eine große Anzahl von Benutzern betrifft und dem Unternehmen einen oder mehrere wichtige Services vorenthält. Aufgrund der Dringlichkeit der Lage ist eine gut koordinierte Reaktion erforderlich, um die Lösung zu beschleunigen und die geschäftliche Beeinträchtigung zu minimieren.

    Das Ziel einer Organisation ist ein effektives und effizientes System zur Reaktion auf schwerwiegende Incidents. Die Anforderungen sind:
    • Die Auswirkungen von Serviceunterbrechungen möglichst gering halten.
    • Stellen Sie sicher, dass ein geeigneter Incident-Manager/ein Team für schwerwiegende Incidents/eine Managementgruppe vorhanden ist, um einen schwerwiegenden Incident zu verwalten.
    • Sicherstellen, dass die Stakeholder über Serviceunterbrechungen, Verschlechterungen und Lösungen informiert werden.
    • Bei schwerwiegenden Incidents immer eine Überprüfung durchführen, sobald der Service wiederhergestellt wurde. Diese dient dazu, den Incident zu analysieren und nachzuvollziehen, wie ein ähnlicher Incident in der Zukunft vermieden werden kann. Diese Überprüfung bietet auch eine Möglichkeit, den Reaktionsprozess bei Incidents auszuwerten und Bereiche mit Verbesserungspotenzial zu identifizieren.
    • Zur Ursachenanalyse ein Problem erstellen.
    Bei der Verfolgung der Ziele kann das Management schwerwiegender Incidents grob in folgende Phasen unterteilt werden:
    Identifizierung
    Der erste Schritt besteht in der Identifikation eines potenziellen schwerwiegenden Incident. Ein potenziell schwerwiegender Incident kann automatisch über Auslöserregeln ermittelt werden, oder ein vorhandener Incident kann als Kandidat für einen schwerwiegenden Incident vorgeschlagen werden. Diese Incidents werden als Kandidaten für schwerwiegende Incidents klassifiziert und von Managern für schwerwiegende Incidents geprüft. Diese leiten dann das Reaktionsverfahren für schwerwiegende Incidents ein.
    Kommunikation und Collaboration
    Rechtzeitige Kommunikation bei schwerwiegenden Incidents ist unerlässlich, um sicherzustellen, dass IT-Teams, Stakeholder, Endbenutzer und Kunden über die Auswirkungen und die Bearbeitung des Incident informiert sind. Das Auftreten schwerwiegender Incidents erfordert einen umfassenden Kommunikationsplan, der u. a. berücksichtigt, wer wie und wie oft kontaktiert wird. Der Kommunikationsplan ermöglicht dem Incident-Antwortteam, sich auf die Lösung zu konzentrieren, und definiert die Erwartungen an zukünftige Kommunikation.

    Sie können einen oder mehrere Kommunikationspläne nach Typ, Priorität des Incident oder Zielgruppe erstellen. Beispielsweise könnten Kommunikationspläne für schwerwiegende Incidents mit Priorität P1 häufigere Kommunikation erfordern als ein Kommunikationsplan für schwerwiegende Incidents mit P2.

    Während des gesamten Lebenszyklus des schwerwiegenden Incident werden Benachrichtigungen und Statusaktualisierungen an die Beteiligten gesendet, um sie auf dem Laufenden zu halten und einzubeziehen.

    Lösung
    In dieser Phase wird der vereinbarte Weg zur Lösung des Problems verfolgt. Wird ein schwerwiegender Incident als gelöst gekennzeichnet, werden alle verknüpften Nachfolge-Incidents ebenso als gelöst gekennzeichnet, und die einzelnen Anrufer werden benachrichtigt, dass der Incident gelöst wurde.
    Incident-Überprüfung veröffentlichen
    Dies ist die letzte Phase im Lebenszyklus eines schwerwiegenden Incident. Nach der Lösung eines schwerwiegenden Incident wird eine Nachfolgeprüfung durchgeführt. Diese dient dazu, den Incident zu analysieren und nachzuvollziehen, wie ein ähnlicher Incident in der Zukunft vermieden werden kann. Diese Überprüfung bietet auch eine Möglichkeit, den Reaktionsprozess bei Incidents auszuwerten und Bereiche mit Verbesserungspotenzial zu identifizieren.

    Zur Optimierung des Prozesses wird nach der Lösung eines Incident ein Nachfolgebericht erstellt. Der Nachfolgebericht zum Incident kann während des Überprüfungsprozesses geprüft und aktualisiert werden, bevor er für Stakeholder freigegeben wird.

    Ein schwerwiegender Incident durchläuft während seines Lebenszyklus verschiedene Status. Das folgende Diagramm veranschaulicht die verschiedenen Status, die beim Management eines schwerwiegenden Incident eine Rolle spielen:

    Abbildung : 1. Statusfluss beim Management schwerwiegender Incidents
    Status-Flow bei der Verwaltung schwerwiegender Incidents