Processo do Gestão de incidentes graves

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 3 min. de leitura
  • Um incidente grave é um incidente de maior impacto e urgência que afeta um grande número de usuários, privando a empresa de um ou mais serviços essenciais. Dada a urgência da situação, um processo de resposta bem coordenado é necessário para acelerar a resolução e minimizar o impacto nos negócios.

    O objetivo de uma organização é ter um sistema eficaz e eficiente para responder aos incidentes graves. Os requisitos são:
    • Minimize o impacto das interrupções de serviço.
    • Garantir que um Gerente de incidentes/uma Equipe de incidentes graves/um Grupo de gestão estejam à disposição para lidar com um incidente grave.
    • Certifique-se de que as partes interessadas estejam bem informadas sobre interrupções, degradações e resoluções de serviço.
    • Realize uma revisão de cada incidente grave depois que o serviço for restaurado. Sua finalidade é analisar o incidente e entender o que pode ser feito para evitar um incidente semelhante no futuro. Esta revisão também oferece uma oportunidade de avaliar o processo de resposta a incidentes e identificar áreas para melhoria.
    • Crie um problema para análise de causa raiz.
    Mantendo os objetivos em mente, um processo de gerenciamento de incidentes graves pode ser amplamente classificado nas seguintes fases:
    Identificação
    A primeira etapa do processo é identificar um possível incidente grave. Um possível incidente grave pode ser identificado automaticamente com base nas regras do gatilho ou um incidente existente pode ser proposto como um candidato a incidente grave. Esses incidentes são classificados como candidatos a incidentes graves e são revisados por gerentes de incidentes graves que iniciam o processo de resposta a incidentes graves.
    Comunicação e colaboração
    A comunicação oportuna durante um incidente grave é crucial para garantir que as equipes de TI, as partes interessadas nos negócios, os usuários finais e os clientes sejam informados sobre o impacto e o andamento do incidente. Uma ocorrência de um incidente grave requer um plano de comunicação abrangente que inclui quem é contatado, os métodos e a frequência da comunicação, mensagens e assim por diante. O plano de comunicação permite que a equipe de resposta a incidentes concentre seus esforços no processo de resolução e defina expectativas para comunicações futuras.

    Você pode definir um ou mais planos de comunicação com base no tipo, na prioridade do incidente ou no público-alvo. Por exemplo, planos de comunicação para um incidente grave P1 podem ter comunicação mais frequente do que um plano de comunicação para um incidente grave P2.

    Ao longo do ciclo de vida do incidente grave, notificações e atualizações de status são enviadas para as partes interessadas para mantê-las informadas e envolvidas.

    Resolução
    Nesta fase, o caminho acordado para a resolução é seguido para resolver o problema. Resolver um incidente grave resolve todos os incidentes secundários associados e os chamadores individuais recebem uma notificação sobre a resolução do incidente.
    Publicar análise de incidente
    Esta é a fase final de um ciclo de vida de incidente grave. Depois que o incidente grave é resolvido, uma revisão pós-incidente é realizada. Sua finalidade é analisar o incidente e entender o que pode ser feito para evitar um incidente semelhante no futuro. Esta revisão também oferece uma oportunidade de avaliar o processo de resposta a incidentes e identificar áreas para melhoria.

    Para simplificar o processo, um relatório pós-incidente é criado quando um incidente é resolvido. O relatório pós-incidente pode ser revisado e atualizado durante o processo de revisão antes de ser compartilhado com as partes interessadas.

    Um incidente grave progride em diferentes estados durante seu ciclo de vida. O diagrama a seguir ilustra os diferentes estados envolvidos em um gerenciamento de incidentes graves:

    Figura 1. Fluxo de estado de gerenciamento de incidentes graves
    Fluxo de estado de gestão de incidentes graves