Processus Gestion des incidents majeurs

  • Rversion finale: Zurich
  • Mis à jour 31 juil. 2025
  • 3 minutes de lecture
  • Un incident majeur est un incident à fort impact et à urgence élevée qui affecte un grand nombre d'utilisateurs, privant l'entreprise d'un ou de plusieurs services cruciaux. Compte tenu de l'urgence de la situation, un processus de réponse bien coordonné est requis pour accélérer la résolution et réduire l'impact sur l'activité.

    L'objectif d'une organisation est d'avoir un système efficace et efficient pour répondre aux incidents majeurs. Les exigences sont de :
    • Minimiser l'impact des interruptions de service.
    • S'assurer qu'un gestionnaire d'incidents/une équipe d'incidents majeurs/un groupe de gestion approprié est en place pour gérer un incident majeur.
    • Veiller à ce que les personnes concernées soient bien informées des interruptions de service, des dégradations et des résolutions.
    • Effectuer un examen de chaque incident majeur une fois le service rétabli. Son objectif est d'analyser l'incident et de comprendre ce qui peut être fait pour empêcher un incident similaire dans le futur. Cet examen permet également d'évaluer le processus de réponse à un incident et d'identifier les domaines d'amélioration.
    • Créer un problème pour l'analyse de la cause première.
    En gardant ces objectifs à l'esprit, un processus de gestion des incidents majeurs peut être classé plus largement dans les phases suivantes :
    Identification
    La première étape du processus consiste à identifier un incident majeur potentiel. Un incident majeur potentiel peut être identifié automatiquement en fonction des règles de déclenchement ou un incident existant peut être proposé comme candidat aux incidents majeurs. Ces incidents sont classés en tant que candidats d'incidents majeurs et sont examinés par les gestionnaires d'incidents majeurs qui initient le processus de réponse aux incidents majeurs.
    Communication et collaboration
    Une communication en temps opportun au cours d'un incident majeur est essentielle pour garantir que les équipes informatiques, les personnes concernées de l'entreprise, les utilisateurs finaux et les clients soient informés de l'impact et de la progression de l'incident. Une occurrence d'un incident majeur nécessite un plan de communication complet qui inclut qui est contacté, les méthodes et la fréquence de la communication, la messagerie, etc. Le plan de communication permet à l'équipe de réponse aux incidents de concentrer ses efforts sur le processus de résolution et définit les attentes pour toutes les communications futures.

    Vous pouvez définir un ou plusieurs plans de communication basés sur le type, la priorité de l'incident ou l'audience cible. Par exemple, les plans de communication pour un incident majeur P1 peuvent avoir une communication plus fréquente qu'un plan de communication pour un incident majeur P2.

    Tout au long du cycle de vie de l'incident majeur, des notifications et des mises à jour de statut sont envoyées aux personnes concernées pour les tenir informées et impliquées.

    Résolution
    Dans cette phase, le plan de résolution est suivi pour résoudre le problème. La résolution d'un incident majeur résout tous les incidents enfants associés, et les appelants individuels reçoivent une notification à propos de la résolution des incidents.
    Revue post-incident
    Il s'agit de la dernière phase du cycle de vie d'un incident majeur. Après la résolution de l'incident majeur, un examen post-incident est effectué. Son objectif est d'analyser l'incident et de comprendre ce qui peut être fait pour empêcher un incident similaire dans le futur. Cet examen permet également d'évaluer le processus de réponse à un incident et d'identifier les domaines d'amélioration.

    Pour optimiser le processus, un rapport post-incident est créé quand un incident est résolu. Le rapport post-incident peut être examiné et mis à jour pendant le processus d'examen avant d'être partagé avec des personnes concernées.

    Un incident majeur progresse à travers différents états au cours de son cycle de vie. Le schéma suivant illustre les différents états impliqués dans la gestion d'un incident majeur :

    Figure 1. Flux d'état de gestion des incidents majeurs
    Flux d'état de gestion des incidents majeurs