Processus de Gestion des incidents majeurs dans Espace de travail pour l'exploitation des services
Un incident majeur, qui a un impact et un niveau d'urgence élevés, affecte un grand nombre d'utilisateurs et prive l'entreprise d'un ou de plusieurs services cruciaux. Compte tenu de l'urgence de la situation, un processus de réponse bien coordonné est requis pour accélérer la résolution et réduire l'impact sur l'activité.
- Réduire l'impact des interruptions de service.
- S'assurer qu'un gestionnaire d'incidents, une équipe d'incidents majeurs ou un groupe de gestion approprié est en place pour gérer un incident majeur.
- Communiquer aux personnes concernées les mises à jour concernant les interruptions de service, les dégradations, les résolutions et d'autres incidents majeurs.
- Collaborer avec les personnes concernées pour résoudre l'incident majeur et restaurer le service.
- Créer un enregistrement de problème pour analyser la cause première.
- Générer un rapport post-incident (PIR) pour examiner chaque incident majeur une fois le service restauré.
Le processus de Gestion des incidents majeurs peut être classé dans les phases suivantes.
- Identification et détection des Incident majeur
-
La première phase du processus consiste à identifier un candidat aux incidents majeurs potentiel. Vous pouvez détecter et identifier les incidents majeurs des manières suivantes :
- Un incident est détecté en fonction des règles de déclencheur d'incidents majeurs configurées et est soit proposé comme candidat aux incidents majeurs, soit promu automatiquement et directement en incident majeur.
- Un agent examine les informations de l'incident pour déterminer si l'incident doit être proposé à un candidat aux incidents majeurs. Si c'est le cas, un gestionnaire d'incidents majeurs examine les informations du candidat aux incidents majeurs et promeut le candidat en incident majeur.
- Un gestionnaire d'incidents majeurs crée directement un incident majeur sans passer par le processus de proposition.
- Communication et collaboration
- La deuxième phase est celle de la communication. Une communication correcte au cours d'un incident majeur est essentielle pour garantir que les équipes informatiques, les personnes concernées de l'entreprise et les utilisateurs finaux soient informés de l'impact et de la progression de l'incident majeur.
La communication tout au long d'un incident majeur nécessite un plan de communication complet qui détermine les personnes à contacter, les méthodes et la fréquence de la communication, ainsi que les canaux de messagerie utilisés pour l'assistance, tels que les e-mails et les SMS. Un plan de communication permet à l'équipe de réponse aux incidents de concentrer ses efforts sur le processus de résolution et définit les attentes pour toutes les communications futures.
Vous pouvez définir un ou plusieurs plans de communication en fonction du type, de la priorité de l'incident et de l'audience cible de l'incident majeur. Tout au long du cycle de vie de l'incident majeur, des notifications et des mises à jour de statut sont envoyées aux personnes concernées pour les tenir informées et impliquées.
Outre les communications, une collaboration efficace avec les équipes informatiques et d'autres personnes concernées de l'entreprise est également importante lors de la résolution d'un incident majeur. Vous pouvez utiliser les canaux de communication, notamment les téléconférences Microsoft Teams, pour collaborer et travailler à la résolution des problèmes. La page d'enregistrement d'incidents dans Espace de travail pour l'exploitation des services fournit diverses commandes de collaboration. Pour plus d'informations, consultez Collaborer avec les personnes concernées lors d'un incident majeur.
- Résolution
- La phase suivante du cycle de vie d'un incident majeur consiste à résoudre l'incident majeur. La résolution d'un incident majeur résout également tous les incidents enfants associés, et les appelants individuels reçoivent une notification à propos de la résolution des incidents.
- Création d'un enregistrement de problème
- Vous devez créer un enregistrement de problème pour analyser la cause première de l'incident majeur. Vous pouvez configurer le flux Créer un problème à partir d'un incident majeur pour créer automatiquement un enregistrement de problème après la résolution d'un incident majeur ou créer manuellement un enregistrement de problème, selon les besoins. Vous pouvez par ailleurs indiquer si les informations d'incident majeur sont automatiquement copiées dans un enregistrement de problème lors de la création d'un enregistrement de problème.
- Examen du rapport post-incident
- La dernière phase du cycle de vie d'un incident majeur consiste à générer un rapport post-incident (PIR). Une fois l'incident majeur résolu, un PIR est généré. Vous pouvez utiliser un PIR pour analyser l'incident et savoir comment empêcher un incident similaire dans le futur. Cet examen permet également d'évaluer le processus de réponse à un incident et d'identifier les domaines d'amélioration. Le rapport contient la chronologie des événements qui se sont produits après la création d'un incident. Vous pouvez passer en revue le PIR et le mettre à jour au cours du processus d'examen avant de le partager avec les personnes concernées.