Explorando Observabilidade de serviços
Observabilidade de serviços ajuda as equipes de operações a fazer a triagem e gerenciar incidentes em um sistema de produção complexo e distribuído. Ele combina telemetria de sistemas de monitoramento de desempenho de aplicações externas (APM) com dados relacionados do Configuration Management Database (CMDB) e exibem ambos em um único fluxo de trabalho no Espaço de operações de serviços( SOW).
Visão geral Observabilidade de serviços
Observabilidade de serviços exibe métricas de integridade no SOW relacionado a um determinado serviço. As métricas podem ser ingeridas de um sistema de APM externo e exibidas ao lado das informações de itens de configuração relacionados no CMDB.
Observabilidade de serviços Compatível com os seguintes fornecedores de APM:
- Amazon CloudWatch
- Datadog
- Dynatrace
- Microsoft Azure Monitor
- New Relic
- SolarWinds no local
- Splunk Observabilidade
- MySQL
- PostgreSQL (não compatível com Splunk)
- RDS (serviço de banco de dados relacional) ( Amazon CloudWatch)
Depois de conectar uma instância do APM a. Observabilidade de serviços, você mapeia serviços no CMDB Para as métricas do APM usando marcadores existentes nos dados do APM.
Com este mapeamento de dados, Observabilidade de serviços Pode exibir métricas em um só lugar de entidades de APM associadas ao seu serviço, como um host ou banco de dados, junto com informações de itens de configuração (ICs) relacionados. Os operadores usam as métricas de APM, as informações de IC relacionadas e informações contextuais úteis, como incidentes e alertas atuais relacionados ao serviço, para entender a integridade do serviço.
Por exemplo, digamos que você use Dynatrace para monitorar seu check-out o serviço e as métricas do seu banco de dados e do host usam o marcador check-serviço para denotar solicitações provenientes desse serviço. Mapeando o. check-out IC de serviço para os dados do APM marcados com check-serviço , Observabilidade de serviços Recupera métricas desses bancos de dados, hosts e ICs relacionados ao serviço e os exibe juntos. Os operadores podem identificar problemas em entidades relacionadas ao serviço e restringir o processo de mitigação sem precisar sair do SOW.
Observabilidade de serviços usuários
| Usuário | Descrição |
|---|---|
| Administrador do sistema |
Versão 1,5 somente. Os administradores do sistema configuram usuários e equipes, Registram serviços a serem monitorados e se conectam Observabilidade de serviços Para APMs e mapeie esses serviços para esses dados. Eles também podem exibir os dados no SOW |
| Administrador da Observabilidade de serviços | Versão 1,6.x e posterior. Observabilidade de serviços os administradores podem configurar usuários e equipes, conectar Observabilidade de serviços Para APMs e mapeie serviços para esses dados. Eles também podem exibir os dados no SOW. Os administradores também podem personalizar modelos de painel usados para exibir métricas e informações relacionadas. |
| Gerente de operações/operador Nota: Esses usuários devem pertencer a um srm tipo de grupo para ver todos os dados. |
Os operadores usam Observabilidade de serviços ao fazer a triagem de incidentes no SOW. Eles podem exibir métricas básicas de integridade de um serviço, junto com incidentes, alertas e mudanças relacionados. Eles podem obter informações mais detalhadas navegando até Observabilidade para exibir métricas de serviço adicionais, junto com métricas de entidades relacionadas, como um host ou banco de dados. |
Fluxo de trabalho do Observabilidade de serviços
Os administradores configuram Observabilidade de serviços Registrando serviços, conectando métricas de APM e mapeando os serviços para esses dados. Os operadores usam Observabilidade de serviços determinar se outra entidade relacionada está causando problemas que o desempenho do serviço apresenta.
Como administrador, você:
- Determine os serviços a serem monitorados Observabilidade de serviços com base na criticidade dos negócios.
- Conecte instâncias de APM existentes a Observabilidade de serviços.
- Mapeie serviços com dados de métrica de APM com base em marcadores baseados em APM usados nesses dados.
- Personalize os modelos usados para exibir gráficos de métrica.
Como operador ou gerente, você:
- Detectar um problema com um serviço ao trabalhar no SOW, Por exemplo, a partir de um alerta, o painel de serviço ou Lista expressa, Em seguida, navegue até a página Detalhes do serviço.
- Exiba métricas de integridade geral do serviço, junto com incidentes, alertas e mudanças relacionados. Se uma das métricas não estiver íntegro, navegue até a guia Observabilidade.
- Exiba métricas de serviço mais detalhadas, bem como informações de entidades relacionadas, para iniciar a investigação da causa raiz. Ao descobrir que o problema está mais abaixo da pilha do sistema, identifique a propriedade dessa entidade para iniciar a correção.
Benefícios do Observabilidade de serviços
| Benefício | Recurso | Usuários |
|---|---|---|
Centralize os sinais críticos e os fluxos de trabalho de ponte para aumentar a agilidade e a confiabilidade:
|
. | Administradores |
| Aumente a eficiência e reduza o tempo médio de resolução (MTTR) exibindo métricas combinadas de entidades associadas a um serviço. Você pode começar a determinar o raio de explosão e a propriedade de um incidente. | Exibir métricas de integridade do serviço | Operadores |
| Consulte mudanças relacionadas ao sistema e alertas associados a um serviço em um só lugar. | Exibir a integridade geral do serviço. | Operadores |
| Personalizar modelos de painel. | Personalizar modelos do painel Observabilidade de serviço | Administradores |