Trabalhar com métricas de confiabilidade
Saiba mais sobre as métricas de confiabilidade e os recursos que podem ajudar você a rastrear a integridade do serviço, responder a problemas e oferecer suporte aos objetivos de negócios.
Painel de confiabilidade de serviços
O painel Confiabilidade do serviço exibe uma exibição personalizável e de alto nível do desempenho do serviço. Ele ajuda a monitorar e gerenciar a confiabilidade usando visualizações que rastreiam estados de serviço, orçamentos de erro e objetivos de nível de serviço (SLOs) ao longo do tempo.
O painel exibe informações sobre todos os serviços do Gestão de confiabilidade de serviços( SRM). Você pode acessar o painel em Espaço de operações de serviços das seguintes maneiras:
- Navegar até .
- Navegar até
Destino de notificação
Os destinos de notificação ajudam a manter as equipes informadas sobre a confiabilidade do serviço. Anexe-os a políticas de orçamento de erro para enviar notificações quando uma política for violada.
Para exibir e gerenciar destinos de notificação em Espaço de operações de serviços, navegue até .
Visite os links a seguir para saber mais sobre como criar e trabalhar com destinos de notificação:
Guia de métricas de confiabilidade
A guia Métricas de confiabilidade mostra o quão bem um serviço específico está cumprindo seus objetivos de confiabilidade. Use-o para rastrear SLOs, indicadores de nível de serviço (SLIs) e orçamentos de erro de um serviço.
Para exibir a guia Métricas de confiabilidade em Espaço de operações de serviços, navegue até .
Consulte estes links para saber mais sobre o que você pode fazer na guia Métricas de confiabilidade:
Tabela de objetivos de nível de serviço
Na guia Métricas de confiabilidade, a tabela Objetivos de nível de serviço inclui os seguintes detalhes sobre o serviço selecionado:
- Objetivo de nível de serviço Nome do SLO. O SLO é um valor de meta ou o objetivo que sua equipe deve alcançar para atender ao seu Acordo de nível de serviço (ANS).
- Tipo de SLI Categoria de desempenho que está sendo medida:
- Porcentagem de tempo em que seu serviço ou item de configuração está disponível, também conhecido como tempo de atividade.
- Erros: Frequência dos erros de serviço.
- Latência: Tempo necessário para atender a uma solicitação.
- Saturação: Plenitude do seu sistema, com foco no uso de recursos.
- Período de conformidade Janela de tempo usada para calcular o desempenho:
- Mês: Mês atual, por exemplo, se a data atual for 26 de janeiro, o mês será de 1 de janeiro a 31 de janeiro.
- 7, 30 ou 90 dias consecutivos: Número de dias a partir da data atual. Por exemplo, para reverter 7 dias, a duração é de 7 dias a partir da data atual.
- Estado Status do SLO, como rascunho, em execução ou descontinuado.
- Objetivo (porcentagem) Percentual de destino do desempenho de SLI.
- Limitar ocorrências Número de violações de limite que ocorreram. Usado somente por SLOs baseados em contagem.
- Indicador de nível de serviço SLI associado ao SLO.
- Orçamento de erro Tempo de falha permitido para o período de conformidade, calculado usando o período de conformidade e o objetivo (porcentagem).
- Orçamento de erros restante Orçamento de erro ainda disponível.
- Ocorrências de violação restantes Número de violações ainda disponíveis antes que o limite seja atingido.