Processo do Gestão de incidentes graves no Espaço de operações de serviços

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 3 min. de leitura
  • Um incidente grave tem alto impacto e urgência, afeta um grande número de usuários e priva a empresa de um ou mais serviços cruciais. Dada a urgência da situação, um processo de resposta bem coordenado é necessário para acelerar a resolução e minimizar o impacto nos negócios.

    Ao responder a incidentes graves, um sistema eficaz e eficiente é necessário para minimizar o alto impacto da interrupção do serviço. Um sistema eficiente envolve as ações a seguir:
    • Minimize o impacto das interrupções de serviço.
    • Garanta que um gerente de incidentes, uma equipe de incidentes graves ou um grupo de gerenciamento apropriado esteja disponível para gerenciar o incidente grave.
    • Comunique às partes interessadas as interrupções de serviço, degradações, resoluções e outras atualizações sobre incidentes graves.
    • Colabore com as partes interessadas a fim de resolver o incidente grave e restaurar o serviço.
    • Crie um Registro de Problema para analisar a causa raiz.
    • Gere um relatório pós-incidente (PIR) para analisar cada incidente grave após o serviço ser restaurado.

    O processo do Gestão de incidentes graves pode ser classificado nas fases a seguir.

    Identificação e detecção do Incidente grave
    A primeira fase do processo é identificar um possível candidato a incidente grave. Você pode detectar e identificar incidentes graves das maneiras a seguir:
    • Um incidente é detectado com base nas regras de gatilho de incidente grave configuradas, sendo proposto como candidato a incidente grave ou promovido diretamente a incidente grave automaticamente.
    • Um agente analisa as informações do incidente para identificar se deve ser proposto como candidato a incidente grave. Se proposto, um gerente de incidente grave analisa as informações do candidato e o promove a incidente grave.
    • O gerente de incidentes graves pode criar um incidente grave diretamente, sem o processo de proposição.
    Comunicação e colaboração
    A 2ª fase é a comunicação. A comunicação apropriada durante um incidente grave é crucial para garantir que as equipes de TI, as partes interessadas nos negócios e os usuários finais sejam informados sobre o impacto e o andamento do incidente grave.

    A comunicação durante um incidente grave exige um plano abrangente, incluindo quem contatar, os métodos e a frequência de comunicação e os canais de envio de mensagens usados para oferecer suporte, como e-mail e SMS. O plano de comunicação permite que a equipe de resposta a incidentes concentre seus esforços no processo de resolução e defina expectativas para comunicações futuras.

    Você pode definir um ou mais planos de comunicação com base no tipo de comunicação, na prioridade do incidente e no público-alvo do incidente grave. Ao longo do ciclo de vida do incidente grave, notificações e atualizações de status são enviadas para as partes interessadas para mantê-las informadas e envolvidas.

    Junto com as comunicações, a colaboração eficaz com as equipes de TI e outras partes interessadas nos negócios também é importante para a resolução de um incidente grave. Você pode usar canais de comunicação, como as chamadas em conferência do Microsoft Teams, para colaborar e trabalhar na resolução de problemas. A página de registro de incidentes do Espaço de operações de serviços fornece vários controles para colaboração. Para obter mais informações, consulte Colaborar com as partes interessadas durante incidentes graves.

    Resolução
    A próxima fase do ciclo de vida do incidente grave é a resolução. Para resolver um incidente grave também é preciso resolver todos os incidentes secundários associados e os chamadores individuais recebem uma notificação sobre a resolução do incidente.
    Criação de registro de problema
    O registro de problema deve ser criado para analisar a causa raiz do incidente grave. Você pode configurar o fluxo Criar problema a partir de incidente grave a fim de criar um registro de problema automaticamente depois que um incidente grave for resolvido, ou criar manualmente um registro de problema, conforme necessário. Você também pode configurar se as informações do incidente grave serão copiadas automaticamente para o registro de problema quando ele for criado.
    Análise do relatório pós-incidente
    A fase final do ciclo de vida do incidente grave é gerar um relatório pós-incidente (PIR). Depois que o incidente grave é resolvido, gera-se um PIR. Você pode usar o PIR para analisar o incidente e entender como ajudar a prevenir uma ocorrência semelhante no futuro. Esta revisão também oferece uma oportunidade de avaliar o processo de resposta a incidentes e identificar áreas para melhoria. O relatório contém a linha do tempo de eventos que ocorreram após a criação do incidente. Você pode analisar e atualizar o PIR durante o processo de análise, antes de compartilhá-lo com as partes interessadas.