Incidentbeheer is een reeks stappen die worden ondernomen om kritieke incidenten die tot problemen in een organisatie kunnen leiden te identificeren, analyseren en op te lossen.
Incidentbeheer is een cruciaal onderdeel van het ITIL-framework (Information Technology Infrastructure Library). ITIL bestaat uit een verzameling best practices die zijn ontworpen voor IT Service Management (ITSM). Het primaire doel is om de IT-services van een organisatie af te stemmen op de bestaande bedrijfsbehoeften. ITIL biedt gedetailleerde beschrijvingen van essentiële IT-werkwijzen, waaronder procedures, taken, processen, checklists enz. Deze werkwijzen zijn niet noodzakelijkerwijs afgestemd op een bepaalde organisatie of de technologie ervan, maar zijn veelzijdig genoeg om waarde te leveren en de strategische groei van het bedrijf te ondersteunen. Hoewel ITIL officieel geen industriestandaard is, wordt het algemeen geaccepteerd en wereldwijd erkend als een nuttig framework voor het leveren van IT-services.
Volgens ITIL is een 'incident' elke ongeplande onderbreking van een IT-service of een vermindering van de kwaliteit van een IT-service. Het doel van incidentbeheer, zoals beschreven door ITIL, is om de normale dienstverlening zo snel mogelijk te herstellen om de impact op bedrijfsactiviteiten te minimaliseren, zodat de best mogelijke servicekwaliteit en -beschikbaarheid worden gehandhaafd.
Incidenten kunnen de activiteiten verstoren, leiden tot tijdelijke downtime en bijdragen aan het verlies van gegevens. Het wordt steeds belangrijker voor organisaties om de procedures voor incidentbeheer serieus te nemen, omdat er grote voordelen zijn voor het serieus nemen van incidenten.
Enkele voordelen zijn:
Er kunnen gevestigde werkwijzen en procedures zijn die IT-teams kunnen helpen beter te reageren op incidenten en toekomstige incidenten te beperken. Bovendien wijst machine learning incidenten automatisch aan de juiste groepen toe, zodat ze sneller worden afgehandeld. Speciale agentportals voor probleemoplossing hebben toegang tot alle benodigde informatie in één weergave en kunnen AI gebruiken om onmiddellijk aanbevolen oplossingen te leveren. Een speciale portal voor het beheer van ernstige incidenten zorgt voor een snelle oplossing door de juiste teams en belanghebbenden bij elkaar te brengen zodat de services worden hersteld.
Werknemers kunnen eenvoudig contact opnemen met IT-ondersteuning om problemen te volgen en op te lossen. Ze kunnen verbinding maken met IT via de webportal of mobiele app om een beter inzicht te krijgen in de status van hun incidenten van begin tot eind, en de daaropvolgende effecten. Een betere werknemerservaring wordt geboden door intuïtieve, omnichannel selfservice en transparante communicatie in twee richtingen.
Servicemedewerkers hebben de mogelijkheid om incidenten te prioriteren op basis van gevestigde processen, die ook kunnen helpen bij de continuïteit van bedrijfsprocessen, samengebracht om werk te beheren en samen te werken via een enkel platform voor IT-processen. Evenzo maakt incidentbeheer het mogelijk om services sneller te herstellen door de juiste servicemedewerkers samen te brengen om werk te beheren, en samen te werken met behulp van een enkel platform voor IT-processen. IT kan geavanceerde machine learning en gegevensmodellen gebruiken om incidenten automatisch te categoriseren en toe te wijzen, waarbij wordt geleerd van patronen uit historische gegevens.
Incidenten kunnen worden gelogd in software voor incidentbeheer, die inzicht biedt in de servicetijd, de ernst van het incident en of er een terugkerend type incident is dat kan worden opgelost. Zo kan de software rapporten genereren voor zichtbaarheid en analyse.
Met systemen voor incidentbeheer kunnen processen worden ontwikkeld die inzicht bieden in SLA-prestaties en waarmee kan worden gecontroleerd of hieraan wordt voldaan.
Zodra incidenten zijn geïdentificeerd en beperkt, kunnen kennis van deze incidenten en noodzakelijke reacties worden toegepast op toekomstige incidenten voor een snellere oplossing of algemene preventie. Verhoog het aantal incidenten door het aantal tickets en telefoontjes te verminderen met een selfserviceportal en handige chatbots. Werknemers kunnen zelf antwoorden vinden voordat ze een incident moeten registreren, waardoor problemen effectief worden voorkomen voordat ze gevolgen hebben voor gebruikers met AIOps (Artificial Intelligence for IT Operations).
De gemiddelde tijd die nodig is voor het oplossen van problemen neemt af wanneer er gedocumenteerde processen en gegevens van eerdere incidenten zijn. Versnel incidentoplossing met behulp van machine learning en contextuele ondersteuning om knelpunten te verhelpen. AIOps-integratie vermindert incidenten en gemiddelde oplossingstijd (MTTR).
Incidenten veroorzaken downtime, wat bedrijven kan vertragen of belemmeren bij het uitvoeren van activiteiten en services. Goed gedocumenteerde processen voor incidentbeheer helpen bij het verminderen of volledig elimineren van downtime die optreedt als gevolg van een incident.
Soepele activiteiten binnen een bedrijf worden weerspiegeld in een product of service. Werknemers zullen een betere ervaring hebben als bedrijven geen downtime of een onderbreking in services ervaren als gevolg van een incident. Op dezelfde manier stelt het bieden van omnichannel-opties, waarbij werknemers incidenten kunnen indienen via selfserviceportals, chatbots, e-mail, telefoon of mobiel, hen in staat om eenvoudig contact op te nemen met ondersteuning om problemen met incidentbeheer te volgen en op te lossen.
IT-incidenten nemen veel verschillende vormen aan en niet elk potentieel probleem vereist hetzelfde soort herstel. Organisaties profiteren echter van het opzetten van een consistent intern proces voor het identificeren, onderzoeken, oplossen en beoordelen van IT-incidenten. Aangezien ITIL zo'n uitgebreid framework is, kiezen de meeste IT-teams gewoon wat ze nodig hebben om het soort IT-incidenten aan te pakken waarmee ze waarschijnlijk te maken krijgen. Het einddoel is het creëren van een uitgebreide, herhaalbare workflow die het unieke incidentbeheerproces van de organisatie kan stroomlijnen.
Om dit mogelijk te maken, stellen de ITIL-richtlijnen voor incidentbeheer de volgende stappen voor:
Een incident wordt geïdentificeerd en geregistreerd in gebruikersrapporten en met behulp van oplossingsanalyse. Zodra het is geïdentificeerd, wordt het incident geregistreerd en gecategoriseerd. Dit is belangrijk voor de manier waarop toekomstige incidenten kunnen worden afgehandeld en voor het prioriteren van incidenten.
De timing van deze stap kan per incident verschillen, afhankelijk van de categorisering van het incident. Kleinere incidenten kunnen ook worden geregistreerd en bevestigd zonder dat er een officiële waarschuwing wordt gegenereerd. Escalatie vindt plaats wanneer een incident een waarschuwing activeert en de juiste procedures worden uitgevoerd door de persoon die is aangewezen om de waarschuwing te beheren.
Incidenten moeten worden ingedeeld in de juiste categorie en subcategorie om gemakkelijk te kunnen worden geïdentificeerd en aangepakt. Gewoonlijk vindt classificatie automatisch plaats wanneer de juiste velden zijn ingesteld voor classificatie, prioriteit wordt toegewezen op basis van de classificatie en rapporten snel worden gegenereerd.
De juiste prioritering kan direct invloed hebben op de SLA van een incidentrespons, doordat bedrijfskritieke problemen op tijd worden aangepakt en werknemers geen enkel probleem met de service ervaren.
Het IT-team voert een analyse uit en biedt een oplossing aan de werknemer zodra een incident aan de orde is gesteld. Als er niet onmiddellijk een oplossing beschikbaar is, wordt het incident naar de juiste teams geëscaleerd voor verder onderzoek en diagnose van het incident.
Een IT-team is bedoeld om incidenten zo snel mogelijk op te lossen met behulp van de juiste prioriteitsmethoden. Communicatie kan helpen bij het oplossen en sluiten van tickets, met de mogelijkheid van automatisering om tickets te helpen oplossen. Zodra een incident is opgelost, is er meer vastgelegde informatie en inzicht wat betreft hoe kan worden voorkomen dat het incident opnieuw optreedt of de afhandeltijd kan worden verkort.
Een uitgebreid en gecoördineerd incidentbeheerproces stelt organisaties in staat om problemen effectiever en pijnloos te identificeren en op te lossen voordat ze grote problemen kunnen worden. Pas de volgende best practices toe om optimale resultaten te garanderen:
Ongeacht het niveau van het incident, de urgentie of de positie van de beller, leg alles altijd vast in één tool met zo veel mogelijk details. Houd alle incidenten bij, waardoor de tijd tot respons en oplossing wordt verkort. Er zijn ook geautomatiseerde systemen die de logboeken kunnen afstemmen.
Vul alles grondig in zodat de details kunnen worden gebruikt voor verder onderzoek, het verzamelen van informatie of rapporten die worden gegenereerd.
Vermijd onnodige categorieën en subcategorieën die elders kunnen worden gesorteerd of in de velden kunnen worden beschreven. Vermijd ook zoveel mogelijk het gebruik van opties zoals 'Overig'.
Standaardiseer processen om ervoor te zorgen dat elk teamlid dezelfde procedures volgt en de juiste antwoorden gebruikt voor elk incident. Hierdoor blijft de kwaliteit consistent en uniform.
Oplossingen hoeven niet altijd nieuw en innovatief te zijn. Als er effectieve oplossingen bestaan, gebruik deze dan om de procedures gaande en gestandaardiseerd te houden.
Het correct en consistent trainen van werknemers op alle niveaus biedt een aanzienlijk organisatorisch voordeel. Het kan nuttig zijn om niet-IT-personeel te trainen in het reageren op incidenten op lagere niveaus om IT-personeel te helpen sneller te reageren op incidenten op hoger niveau. Teams die goed zijn getraind, werken ook effectiever samen en communiceren beter.
Een van de belangrijkste aspecten van incidentbeheer is het voorkomen van onnodige overbelasting. Plan zorgvuldig hoe gebeurtenissen worden gecategoriseerd en wat deze categorieën betekenen om te voorkomen dat incidenten over het hoofd worden gezien en dat de responstijden te lang worden. Een goed uitgangspunt is het definiëren van serviceniveau-indicatoren die worden gebruikt om de hiërarchie van prioriteiten te bepalen, bijvoorbeeld het prioriteren van een analyse van de onderliggende oorzaak ten opzichte van oppervlakkige symptomen.
Teams moeten met elkaar communiceren over wie er toezicht houdt op incidenten en wanneer. Stel een on-call-schema in om ervoor te zorgen dat er iemand met de juiste expertise beschikbaar is in het geval van een incident. Breng vervolgens aanpassingen aan op basis van de hoeveelheid verschillende incidenten die individuele werknemers moeten afhandelen.
Stel richtlijnen op om effectieve communicatie tot stand te brengen. Dit is cruciaal voor samenwerking en teameffectiviteit. De richtlijnen moeten bepalen welke kanalen het personeel moet gebruiken, de inhoud van deze kanalen en hoe communicatie moet worden gedocumenteerd. Onjuiste richtlijnen kunnen leiden tot onnodige stress en spanning tijdens responsperioden wanneer er geen standaard is voor de manier waarop werknemers moeten communiceren. Goed gedocumenteerde communicatie helpt teams om de communicatie te verifiëren en alle benodigde details door te geven zonder verlies van informatie.
Stel niveaus of typen wijzigingen vast die individuen kunnen aanbrengen en van wie ze goedkeuring moeten krijgen. Afhankelijk van het systeem en de persoon, moeten ze mogelijk goedkeuring of aanvullende bevestiging vragen voor wijzigingen. Zorg ervoor dat de Raad die toezicht houdt op wijzigingen direct beschikbaar is, zodat de wijzigingsprocedures snel en effectief zijn.
Onderzoek incidenten en evalueer de reden voor het incident. Identificeer preventieve maatregelen die voor het incident hadden kunnen worden genomen en maatregelen die voor toekomstige incidenten moeten worden genomen. Dit zorgt er ook voor dat alle documentatie wordt voltooid en dat er indien nodig een juiste aansprakelijkheids- en compliancetraining is.
Verschillende typen teams benaderen incidentbeheer op verschillende manieren, waarbij elk hun unieke perspectieven en operationele strategieën toepast. De drie meest voorkomende typen incidentbeheerteams zijn:
ITSM-teams zijn traditioneel verantwoordelijk voor end-to-end beheer van IT-services binnen een organisatie. Hun primaire doel is ervoor te zorgen dat IT-services op één lijn zitten met de bedrijfsbehoeften en maximale waarde bieden. ITSM-teams gebruiken gewoonlijk frameworks zoals ITIL (Information Technology Infrastructure Library) om hun processen te begeleiden, en hun focus ligt vaak op servicekwaliteit, klanttevredenheid en continue verbetering.
Op het gebied van incidentbeheer streven ITSM-teams ernaar om de normale dienstverlening zo snel mogelijk na een incident te herstellen, waardoor de impact op de bedrijfsactiviteiten wordt geminimaliseerd. Ze doen dit via gevestigde processen voor incidentidentificatie, registratie, categorisering, prioritering, onderzoek, oplossing en afsluiting. Deze aanpak is meestal reactiever en behandelt incidenten nadat ze zich hebben voorgedaan.
SRE maakt gebruik van aspecten van software-engineering om problemen in operationele omgevingen effectiever aan te pakken. Het primaire doel van Site Reliability Engineering is het creëren van schaalbare en zeer betrouwbare oplossingen, met behulp van software als hulpmiddel voor het beheren van systemen, het oplossen van problemen en het automatiseren van cruciale operationele taken.
SRE-teams hanteren een iets andere benadering van incidentbeheer. Hoewel ze incidenten zeker aanpakken wanneer ze zich voordoen, leggen ze ook een grote nadruk op het voorkomen van incidenten. Dit omvat het ontwerpen van systemen die robuust en veerkrachtig zijn, en het continu meten en verbeteren van de systeembetrouwbaarheid. SRE-teams werken vaak onder een serviceniveauovereenkomst die een bepaald niveau van uptime van het systeem specificeert, en ze streven ernaar de betrouwbaarheid van het systeem binnen deze overeengekomen parameters te handhaven.
DevOps is een methodologie die de functies van het ontwikkelings- en operationele team wil integreren om een uniforme aanpak te creëren waarbij software sneller en betrouwbaarder kan worden gebouwd, getest en vrijgegeven. DevOps kan helpen een cultuur van samenwerking en gedeelde verantwoordelijkheid te bevorderen, waardoor de responstijden bij incidenten verder worden verbeterd.
DevOps-teams pakken incidentbeheer aan met een focus op continue levering en infrastructuur als code. Incidenten worden vaak gezien als kansen voor verbetering en de reactie van het team omvat meestal niet alleen het oplossen van het onmiddellijke probleem, maar ook het aanpassen van de ontwikkelings- en implementatieprocessen om soortgelijke incidenten in de toekomst te voorkomen. Dit kan betekenen dat de code wordt gewijzigd, geautomatiseerde tests worden bijgewerkt of de bewakings- en waarschuwingsmogelijkheden worden verbeterd.
Kortom, ITSM-teams richten zich op het afstemmen van IT-services op bedrijfsbehoeften en zijn vaak reactiever. SRE-teams streven ernaar robuuste systemen te bouwen en incidenten te voorkomen. DevOps-teams zien incidenten als mogelijkheden voor verbetering en streven ernaar hun processen aan te passen om herhaling te voorkomen. Elke aanpak heeft zijn sterke punten en veel organisaties zullen een combinatie van deze strategieën gebruiken om incidenten effectief te beheren.
Waarschuwingssystemen zijn essentieel voor tijdige incidentdetectie, continue bewaking van verschillende aspecten van het systeem en het verzenden van waarschuwingen wanneer afwijkingen of potentiële incidenten worden gedetecteerd. Hierdoor kunnen IT-teams snel reageren op incidenten, waardoor de tijd tussen het optreden van incidenten en de oplossing wordt verkort. Waarschuwingssystemen kunnen incidenten ook classificeren op basis van ernst, waardoor teams hun respons kunnen prioriteren.
AI en virtuele agents transformeren de manier waarop incidenten worden beheerd. AI kan incidenten uit het verleden analyseren en leren om de voorspelling, detectie en oplossing van incidenten te verbeteren. Virtuele agenten, zoals chatbots, kunnen direct antwoorden geven op veelvoorkomende vragen en basistaken voor probleemoplossing uitvoeren, waardoor menselijke servicemedewerkers meer complexe incidenten kunnen afhandelen.
AIOps combineert machine learning en big data om IT-activiteiten te automatiseren en het incidentbeheerproces verder te stroomlijnen. Door enorme hoeveelheden gegevens in realtime te analyseren, kunnen AIOps patronen en afwijkingen ontdekken die kunnen wijzen op potentiële incidenten. Het kan ook oplossingen voorstellen op basis van historische gegevens, waardoor het oplossen van incidenten efficiënter wordt en proactieve preventie en beperking van incidenten mogelijk wordt.
Chatrooms dienen als een centrale communicatiehub waar alle relevante belanghebbenden in realtime kunnen samenwerken tijdens een incident. Dit kan het afhandelingsproces aanzienlijk versnellen door de coördinatie te verbeteren en de communicatiekloof tussen teamleden te verkleinen. Moderne chattools worden vaak geleverd met functies zoals het delen van bestanden en integratie met andere tools voor incidentbeheer, waardoor de effectiviteit ervan wordt verbeterd.
Goede documentatie verbetert het inzicht in incidenten, helpt bij analyse na incidenten en biedt inzichten voor toekomstige incidentpreventie. Documentatietools helpen bij het maken, beheren en opslaan van alle incidentgerelateerde informatie op een manier die is georganiseerd en eenvoudig te zoeken is. Deze oplossingen worden vaak geleverd met functies zoals sjablonen en gezamenlijke bewerking, waardoor het eenvoudiger wordt om uitgebreide en nauwkeurige incidentrapporten te maken.
Met tools voor incidenttracking kunnen organisaties alle incidenten gedurende hun levenscyclus documenteren, van de eerste detectie tot de definitieve afhandeling. Ze helpen bij het toewijzen van incidenten aan de juiste teams, het volgen van de voortgang van de incidentafhandeling en het bijhouden van een historisch overzicht van incidenten. Deze gearchiveerde gegevens zijn een waardevolle bron voor het lokaliseren van patronen, het verbeteren van procedures en het trainen van nieuwe teamleden.
Videochattools bieden een persoonlijk communicatieplatform voor teamleden die zich mogelijk niet op dezelfde locatie bevinden. Dit kan met name handig zijn voor complexe incidenten die gedetailleerde discussie en samenwerking tussen afdelingen of met aannemers of externe werknemers vereisen. Videochat kan ook nuttig zijn voor het opbouwen van teamsamenhang en het verbeteren van de algehele efficiëntie van het incidentbeheerproces.
ServiceNow IT Service Management biedt incidentbeheer, waarmee werknemers productief en tevreden kunnen blijven door gebruiksvriendelijke contactondersteuning te bieden om problemen te volgen en op te lossen. Gebruikers kunnen eenvoudig verbinding maken met IT via een selfserviceportal, chatbot, e-mail, telefoon of mobiele app. Hierdoor kunnen werknemers kiezen hoe ze incidenten willen indienen.
IT-servicemedewerkers zullen ook blij zijn. Speciale agentportals voor probleemoplossing bevatten alle benodigde informatie in één overzicht . Er is ook een speciale portal voor Major Incident Management (beheer van ernstige incidenten) die zorgt voor een snelle afhandeling door de juiste teams en belanghebbenden bij elkaar te brengen zodat de services worden hersteld. Mobiele agent geeft IT-servicemedewerkers toegang tot een mobiele app om incidenten onderweg te beoordelen, op te pakken en op te lossen.
Daarnaast biedt ServiceNow-incidentbeheer 24 uur per dag ondersteuning en geeft servicedeskpersoneel een duidelijk overzicht van de workflows voor probleemoplossing via een playbook voor incidentrespons. Visuele taakoverzichten bevorderen intuïtieve, effectieve samenwerking en de Configuratiebeheerdatabase (CMDB) creëert één registratiesysteem om gebruikers te helpen de gevolgen van individuele incidenten beter te begrijpen.
En met geleide configuratie kun je incidentbeheer van ServiceNow snel en eenvoudig implementeren.
Stel servicemedewerkers in staat om via één enkel IT-platform samen te werken en taken te beheren.
Geef werknemers meer mogelijkheden met omnichannel-selfservice en tweerichtingscommunicatie.
Bied selfserviceportals en intelligente chatbots zodat werknemers over de tools beschikken om hun eigen problemen op te lossen zonder de hulp van IT.
Machine learning en AI wijzen incidenten automatisch toe aan de juiste oplossingsgroep voor een snellere effectieve afhandeling en leveren onmiddellijk aanbevolen oplossingen.
Neem vandaag nog contact op met ServiceNow en ontdek hoe de juiste aanpak van incidentbeheer je bedrijf kan stimuleren.
Ontketen je innovatie met onze moderne, cloudgebaseerde en silodoorbrekende ITSM-oplossing