Explorando Gestão de confiabilidade de serviços

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 4 min. de leitura
  • Gestão de confiabilidade de serviços( SRM fornece uma experiência orientada de autoatendimento para que as equipes gerenciem a integridade do serviço. A experiência é criada usando a aplicação Espaço de operações de serviços e combina recursos de ITOM e ITSM em um único fluxo de trabalho.

    Visão geral SRM

    Otimize a integridade do serviço com práticas de engenharia de confiabilidade do local (SRE). SRMÉ um único espaço de operações que capacita as equipes a melhorar a confiabilidade dos serviços digitais com SRE.
    • Use escalações de plantão para responder aos problemas em tempo hábil.
    • Reduza o atrito de configuração com o autoatendimento guiado para integrar equipes distribuídas com dados separados, acesso capacitado e governança mínima da TI central.

    Quando SRM está instalado, vários plug-ins e aplicações também estão ativados. Para obter mais informações, consulte Plug-ins ou aplicações instalados com Integridade do ITOM.

    SRM usuários

    Tabela 1. Usuários
    Usuários Descrição Contém as funções
    administrador

    Um administrador de ServiceNow é responsável pela administração, o desenvolvimento, a operação, a formação e a manutenção da plataforma da ServiceNow.

    Responsável pela instalação e pode executar a configuração da Central de administração da Espaço de operações de serviços de SRM.

    Tudo
    Administrador [srm_admin]
    Nota:
    Esta função é diferente de ServiceNow função de administrador.

    Os administradores de SRM podem gerenciar configurações de conta, configurações e usuários.

    Os administradores podem executar as funções a seguir:
    • Acesse, crie, edite ou exclua todas as configurações de SRM.
    • Adicione ou gerencie integrações.
    • Crie integrações com ferramentas de Monitoramento de desempenho de aplicações (APM).
    • Configurar e manter métricas de confiabilidade.
    • Configurar e manter políticas de orçamento de erros.
    • Gerente
    • Respondente
    Gerente [srm_manager] Os gerentes supervisionam uma equipe de SREs. Os gerentes atribuem SREs à programação de plantão da equipe, monitoram seu desempenho e criam procedimentos para lidar com incidentes e desenvolver soluções. Os gerentes promovem resiliência em todos os sistemas e fluxos de trabalho de DevOps.
    Os gerentes podem executar as seguintes ações dentro do contexto de suas respectivas equipes:
    • Defina e configure equipes, cronogramas de plantão e serviços.
    • Adicione e exclua usuários, como respondentes e gerentes, das equipes das quais eles fazem parte.
    • Adicione ou gerencie integrações.
    • Crie integrações com ferramentas de Monitoramento de desempenho de aplicações (APM).
    • Configurar e manter métricas de confiabilidade.
    • Configurar e manter políticas de orçamento de erros.
    Respondente
    Respondente [srm_responder]

    Um engenheiro de confiabilidade de serviço (SRE) que usa o SRM para executar tarefas diárias. Os respondentes são os indivíduos que estão de plantão e diagnosticam e corrigem incidentes.

    Os respondentes só podem acessar as configurações das quais fazem parte. Eles só podem acessar os alertas ou incidentes para os quais têm permissão.

    Os SREs podem executar as seguintes ações no contexto de suas equipes:
    • Configure serviços, equipes e integrações.
    • Confirme os cronogramas de plantão.
    • Gerencie registros de incidentes e alertas.
    • Atualize as equipes que elas criaram.
    • Adicione outros respondentes.
    • Crie integrações com ferramentas de Monitoramento de desempenho de aplicações (APM).
    • Configurar e manter métricas de confiabilidade.
    • Configurar e manter ações de orçamento de erro.
    Herda 17 funções, incluindo as seguintes:
    • cmdb_read
    • sn_sow.sow_user
    • sn_sow_srm.srm_responder
    • workspace_user
    • slo_operator

    Para obter mais informações, consulte SRM funções e responsabilidades.

    Fluxo de trabalho do SRM

    Infográfico que mostra como respondentes, gerentes e administradores gerenciam equipes, Registram serviços, definem SLO, monitoram integrações, respondem a notificações, e corrigir incidentes. Para mais detalhes, consulte a seguinte descrição.
    1. As equipes de produto em TI ou Linhas de negócios fornecem continuamente novos serviços técnicos e de aplicações. Novo portal de faturamento do cliente.
    2. Junto com Gestão de SLO, As equipes podem registrar serviços e definir objetivos de nível de serviço (SLOs), ajudando-as a alcançar resultados de negócios. Exemplo: 95% de disponibilidade mensal para o portal de faturamento.
    3. As integrações de monitoramento são configuradas pelas equipes para coletar a integridade em tempo real desses serviços. Exemplo: Observabilidade de nuvem.
    4. O monitoramento cria indicadores de nível de serviço (SLIs) que afetam alertas quando os serviços estão abaixo do desempenho. Grupos de automação e enriquece. Exemplo: A latência do portal de faturamento excede 7 segundos
    5. Quando os alertas indicam uma indisponibilidade ou degradação que afeta o cliente, os incidentes são criados e as notificações de plantão notificam os recursos apropriados da equipe. Exemplo: Uma equipe de SRE de faturamento é notificada por telefone sobre um problema de latência no portal de faturamento.
    6. Depois que as equipes diagnosticam e corrigem incidentes de forma colaborativa, elas identificam itens de ação para melhorar a resiliência do sistema. Exemplo: A equipe de faturamento decide adicionar capacidade adicional do servidor web.
    7. A gestão revisa continuamente o desempenho do SLO, ajuda a evitar mudanças quando o orçamento de erros é esgotado e prioriza iniciativas de melhoria para serviços com desempenho inferior.

    Benefícios das SRM

    Benefício Recurso Usuários
    Experiência baseada em equipe Trabalhando com equipes da SRM Gerentes e respondentes do SRM
    Registro de serviço Como trabalhar com serviços da SRM Gerentes e respondentes do SRM
    Integrações pré-criadas Trabalhando com integrações da SRM Gerentes e respondentes do SRM
    Medir a integridade do serviço Trabalhar com métricas de confiabilidade Gerentes e respondentes do SRM
    Cobertura de plantão Crie um SRM programação de plantão Gerentes e respondentes do SRM
    Corrija alertas e incidentes de alta gravidade Trabalhando com tarefas de confiabilidade SRM Gerentes e respondentes do SRM