Wat is Site Reliability Engineering (SRE)?

Wat is site reliability engineering (SRE)?

Site reliability engineering is het proces waarbij operationele processen worden gebruikt en aan het software-engineeringteam voor automatisering worden toegewezen.

Demo ITOM

Inhoudsopgave

Wat is SRE?

Geschiedenis van site reliability engineering

Wat doet een site reliability engineer?

Waar past SRE in uw team?

Wat zijn de voordelen van SRE voor uw bedrijf?

Voor- en nadelen van de rol als site reliability engineer

DevOps versus SRE

Technologie ter ondersteuning van SRE

De tools die u nodig hebt voor SRE

Is ServiceNow geschikt voor SRE's?

Alles uitvouwen

Alles samenvouwen

Wat is SRE?

IT-teams zijn voortdurend op zoek naar SRE-methodologieën. Site reliability engineering neemt operationele praktijken over en geeft deze door aan software-engineers voor de automatisering van menselijke taken, probleemoplossing en systeembeheer. Een SRE-team is verantwoordelijk voor veranderingsbeheer, noodhulp, bewaking, beschikbaarheid, prestaties, latentie, efficiëntie en capaciteitsplanning van services, meestal software schrijven voor procesautomatisering.

SRE is een geweldig bedrijfsmiddel voor betrouwbaarheid op het gebied van software en schaalbaarheid, omdat systemen kunnen worden beheerd via code. Dit zorgt voor een balans tussen het betrouwbaar zijn van een product en functies en het vrijgeven van nieuwe producten en functies.

Geschiedenis van site reliability engineering

De term 'SRE' is bedacht door Ben Treynor Sloss van Google

Ben Treynor Sloss van Google is het genie achter SRE en beschrijft dit op een treffende manier als "wat er gebeurt als een software-engineer wordt belast met wat voorheen operations werd genoemd". Het concept is ontstaan na een onderzoek naar de conflicten tussen operations, die ervoor willen zorgen dat functies geen problemen opleveren voor eindgebruikers, en ontwikkelingsteams die nieuwe functies hebben ontwikkeld en willen uitbrengen zodra ze klaar zijn voor een implementatie. SRE is een afstemming tussen de twee.

Een team van Google-technici schreef letterlijk het boek over SRE

Google heeft een boek gepubliceerd over SRE dat gratis online beschikbaar is. Het biedt een diepgaand onderzoek naar de rol van SRE en aanbevolen best practices voor uitvoering. Deel II en III, principes en praktijken (respectievelijk) zijn van toepassing.

SRE-principes: Volgens Google zijn de belangrijkste principes van SRE:

Risico's omarmen: Zorg voor een neutrale aanpak van servicebeheer met behulp van foutbudgetten.
Doelstellingen serviceniveau: Biedt aanbevelingen voor verwarde indicatoren van overeenkomsten en onderzoekt hoe SRE de termen gebruikt.
Hard werk elimineren: Geen last meer van onrust en repetitieve taken die geen waarde hebben.
Controle van gedistribueerde systemen: Zorg ervoor dat u altijd op de hoogte bent van wat er in de organisatie gebeurt, omwille van de betrouwbaarheid.
Release-engineering: Houd zorgvuldig rekening met releases om ervoor te zorgen dat ze consistent zijn en niet bijdragen aan uitval.
Eenvoud: Een systeem dat te complex is, kan de betrouwbaarheid verlagen en het is lastig om terug te schalen naar een eenvoudigere plaats.

SRE Excellentie vereist ervaring

De rol van een site reliability engineer kan het beste worden uitgevoerd door iemand met software-ervaring. Het is zeker geen aanbevolen startpositie. Een juiste uitvoering van SRE vereist een soepele softwaretechniek en inzicht in een systeem van grote schaal en complexiteit.

SRE is een filosofie

Een site reliability engineer heeft de juiste mentaliteit nodig voor deze positie. Technische vaardigheden zijn noodzakelijk, maar een conceptueel begrip van de werkzaamheden is essentieel. Het is belangrijk voor SRE's om te worden gebaseerd op traditionele softwareontwikkelingsprocessen, maar er is ook veel belang bij een holistisch inzicht in de bedrijfsprocessen en het ontwikkelen van een betrouwbaar systeem.

SRE moet verandering aansporen

Het moet de taak zijn van iedereen in de organisatie om zo betrouwbaar mogelijk te zijn en zo de belangrijke principes van SRE toe te passen. Pas een betrouwbaarheidsmodel toe op elk team en neem de tijd om te bespreken hoe betrouwbaarheid in elk team kan passen en iedereen kan beïnvloeden.

Wat doet een site reliability engineer?

Rollen en verantwoordelijkheden van de site reliability engineer (SRE)

Nieuwe introducties zijn goedgekeurd op basis van de huidige productprestaties: Toepassingen zijn doorgaans niet meer dan 100% van de tijd. Het SRE-team is bedoeld om een service level agreement op te stellen om het systeem te definiëren en te bepalen hoe het voor eindgebruikers wordt gebruikt. Een veelvoorkomend onderdeel van een service level agreement is een foutbudget of het maximale drempelbedrag voor storingen en fouten.

SRE's kunnen coderen

Ontwikkelingsteams en SRE's delen personeel, wat betekent dat een extra SRE één ontwikkelaar minder betekent en omgekeerd. Het systeem regelt zichzelf om problemen tussen ontwikkelaars en SRE's voor personeelsbehoeften te voorkomen. SRE's kunnen ook coderen en ontwikkelen, waardoor ze goed kunnen samenwerken met het ontwikkelingsteam.

SRE's mogen van project wisselen, omdat SRE een sterk gevoel van motivatie en toewijding creëert om teamleden in staat te stellen persoonlijke doelen en doelstellingen na te streven.

Algemene rollen en verantwoordelijkheden voor een site reliability engineer

Software ontwikkelen om activiteiten en teams te helpen
Escalatieproblemen oplossen
Processen op afroep optimaliseren
Teamkennis documenteren
Beoordelingen uitvoeren na een incident

Waar past SRE in uw team?

SRE's kunnen direct in de kern van IT-activiteiten, software-engineering en ondersteuning worden geplaatst om een sterke basis en relatie tussen de teams te bieden, wat helpt met feedbacklussen, samenwerking en betrouwbaarheid.

Wat zijn de voordelen van SRE voor uw bedrijf?

Experts op het gebied van site reliability kunnen SRE voor u laten werken

SRE's zoeken naar grote behoeften om verschillende teams naar één doel te leiden.

Automatisering is essentieel voor SRE

Een groot deel van een SRE-rol is het weghalen van inefficiënties en het identificeren van dingen die gemakkelijk te automatiseren zijn. Tijdrovende taken kunnen worden gestopt en de efficiëntie kan worden verhoogd zonder zoveel handmatig werk.

SRE is niet alleen voor technologiebedrijven

SRE-praktijken hoeven niet alleen van toepassing te zijn op de technische industrie. Een cultuur van site reliability engineering kan worden uitgebreid naar e-commerce, klantenservice en productie.

Voor- en nadelen van de rol als site reliability engineer

DevOps versus SRE

DevOps is een methode voor het bouwen en leveren van goede software, waarbij softwareontwikkeling en -werking worden gecombineerd met de bedoeling om operationele en ontwikkelingsrollen samen te voegen. SRE wordt meestal meer gedreven door een ontwikkelingskant dan door de operationele kant van DevOps.

Meer informatie over DevOps
Lever moderne activiteiten voor DevOps- en SRE-teams

Technologie ter ondersteuning van SRE

Linux-apparaten kunnen de benodigde technologie leveren voor een cloudgebaseerde ontwikkeling: De apparaten ondersteunen de integratie van de omgeving voor integratie, automatisering, ontwikkeling en levering. Kubernetes kan noodzakelijke Linux-apparaten automatiseren.

De tools die u nodig hebt voor SRE

Er is geen enkele, uniforme toolset voor SRE. Maar het is van cruciaal belang om SRE-functies binnen een bedrijf samen met automatisering uit te bouwen voor schaalbaarheid en herhaalbaarheid.

Prijzen voor ServiceNow IT Operations Management

Bekijk de prijzen voor ServiceNow ITOM, waarmee je organisatie inzicht krijgt in infrastructuur en apps en hoogwaardige bedrijfsservices kunt leveren.

Bekijk prijzen

Is ServiceNow geschikt voor SRE's?

ServiceNow biedt meer waarde door werk over meerdere teams te koppelen, hun microservices te registreren, waarneembare gegevens te correleren, betrouwbaarheidsgegevens binnen handbereik te brengen, wijzigingen te automatiseren en storingen te voorspellen, en dat allemaal terwijl uw bestaande tools intact blijven.

Capaciteiten die meegroeien met uw bedrijf

Maak uw volgende SRE-transformatieplan met ServiceNow.

Demo ITOM

Contact

Resources

Artikelen

Wat is ServiceNow?

Wat is ITOM?

Wat is cloudcomputing?

Onderzoeksrapporten

IDC: IT-automatisering versnellen

The Forrester Wave™: AIOps - ServiceNow

Autonome serviceactiviteiten – ServiceNow

Datasheets

De waarde van CMDB

ITOM-inzichten

Agentclientcollector (ACC)

E-books

CMDB 101-primer

Servicezichtbaarheid verbeteren

Realiseer indrukwekkende verbeteringen van de servicebeschikbaarheid

Whitepapers

ServiceNow ITOM CMDB

AI-gestuurde serviceactiviteiten om het bedrijf te laten groeien

Profiteer binnen enkele weken van de voordelen van AIOps

Auto-industrie

Bankwezen

Verpakte consumptiegoederen

Gezondheidszorg

Verzekeringen

Life sciences

Productie

Non-profit

Nationale overheid

Detailhandel

Technologieleveranciers

Telecom

Zoek een partner

Partner worden

Partner Awards

Partnerportal

Partner-apps

Carrière

Investeerders

ServiceNow AI-research

Leadership

Locaties

Nieuws

Onderzoeksrapporten

Wereldwijde impact

Vertrouwen en compliance

ServiceNow Shop

AI-agents

IT Service Management

ServiceNow AI Control Tower

IT Operations Management

Klantenservicebeheer

Strategisch portfoliobeheer

IT-assetmanagement

Governance, risico's en compliance

Beveiligingsactiviteiten

Buitendienstbeheer

HR-servicelevering

ServiceNow EmployeeWorks

AI

Gegevens

Workflows

ServiceNow Otto

RaptorDB

Procesmining

AI-agents

ServiceNow AI Control Tower

Beveiliging

App-engine

ServiceNow Store

Verantwoorde AI

Bied betere ervaringen

Los sneller problemen op

Creëer en automatiseer workflows

Organisatiearchitectuur

Werkomgeving voor serviceactiviteiten

Cloud Governance Suite

Beheer van operationele technologie

IT-assetmanagement

IT Operations Management

IT Service Management

ServiceNow Cloud Observability

Strategisch portfoliobeheer

Digitale eindgebruikerservaring

Klantenservicebeheer

Buitendienstbeheer

Verkoop- en orderbeheer

Configure, price, quote

Verkoopautomatisering

Financiële services

Servicebeheer voor gezondheidszorg en biowetenschappen

Verkoop- en orderbeheer voor technologieleveranciers

Verkoop- en orderbeheer voor telecommunicatie

Digitale services voor de publieke sector

Servicebeheer voor telecommunicatie

Servicebeheer voor technologieproviders

Beveiligingsactiviteiten

Reactie op beveiligingsincident

Uniform beveiligingsrisicobeheer

Beveiligingscentrum Threat Intelligence

Geïntegreerd risicobeheer

Third-party Risk Management

Beveiligingspositiecontrole

Privacybeheer

Identiteitsbeveiliging

HR-servicelevering

Talentontwikkeling

Juridische servicelevering

Werkplekservicelevering

Crediteurenactiviteiten

Sourcing and Procurement Operations

Leverancierslevenscyclusactiviteiten