Explorando Observabilidade de serviços

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 3 min. de leitura
  • Observabilidade de serviços ajuda as equipes de operações a fazer a triagem e gerenciar incidentes em um sistema de produção complexo e distribuído. Ele combina telemetria de sistemas de monitoramento de desempenho de aplicações externas (APM) com dados relacionados no Configuration Management Database (CMDB). Ele exibe ambos em um único fluxo de trabalho no Espaço de operações de serviços( SOW).

    Visão geral Observabilidade de serviços

    Observabilidade de serviçosexibe métricas de integridade no SOWrelacionado a um determinado serviço. As métricas podem ser ingeridas de um sistema de APM externo e exibidas junto com métricas para itens de configuração relacionados no CMDB.

    Nota:
    Observabilidade de serviços Compatível com os seguintes fornecedores de APM:
    • Dynatrace
    • New Relic
    Observabilidade de serviços o oferece suporte aos seguintes bancos de dados:
    • MySQL
    • PostgreSQL

    Depois de conectar uma instância de APM a. Observabilidade de serviços, você mapeia os serviços que estão registrados no CMDBPara as métricas de APM usando marcadores existentes nos dados de APM.

    Com este mapeamento de dados, Observabilidade de serviçosPode exibir métricas em um só lugar de entidades de APM associadas ao seu serviço, como um host ou banco de dados, juntamente com informações de ICs relacionados. Os operadores usam as métricas de APM, as informações de IC relacionadas e informações contextuais úteis, como incidentes e alertas atuais relacionados ao serviço, para entender a integridade do serviço.

    Por exemplo, digamos que você use Dynatracepara monitorar seu check-out o serviço e as métricas do seu banco de dados e host usam o marcador check-serviço para denotar solicitações provenientes desse serviço. Mapeando o. check-out IC de serviço para os dados de APM marcados com check-serviço , Observabilidade de serviçosRecupera métricas desses bancos de dados, hosts e ICs relacionados ao serviço e os exibe juntos. Os operadores podem identificar problemas em entidades relacionadas ao serviço e restringir o processo de mitigação sem precisar sair do SOW.

    Observabilidade de serviços usuários

    Tabela 1. Usuários
    Usuário Descrição
    Administrador do sistema Os administradores do sistema configuram usuários e equipes, Registram serviços a serem monitorados e se conectam Observabilidade de serviçosPara APMs e, em seguida, mapeie esses serviços para esses dados. Eles também podem exibir os dados no SOW
    Administrador Observabilidade de serviços os administradores podem registrar serviços únicos a serem monitorados. Eles também podem exibir os dados no SOW.
    Gerente de operações/operador Os operadores usam Observabilidade de serviçosao fazer a triagem de incidentes no SOW. Eles podem exibir métricas básicas de integridade de um serviço, juntamente com incidentes, alertas e mudanças relacionados. Eles podem obter informações mais detalhadas navegando até Observabilidade para exibir métricas de serviço adicionais, juntamente com métricas de entidades relacionadas, como um host ou banco de dados.

    Fluxo de trabalho do Observabilidade de serviços

    Os administradores configuram Observabilidade de serviçosRegistrando serviços, conectando métricas de APM e mapeando os serviços para esses dados. Os operadores usam Observabilidade de serviçospara determinar se outra entidade relacionada está causando problemas enfrentados pelo desempenho do serviço.

    Como administrador do sistema, você:

    1. Determine os serviços a serem monitorados Observabilidade de serviçoscom base na criticidade dos negócios e, em seguida, registre esses serviços.
    2. Conecte instâncias de APM existentes a. Observabilidade de serviços.
    3. Mapeie serviços registrados com dados de métrica de APM com base em marcadores baseados em APM usados nesses dados.

    Como operador ou gerente, você:

    1. Detectar um problema com um serviço ao trabalhar no SOW, Por exemplo, de um alerta, do painel de serviço ou Lista expressa, Em seguida, navegue até a página Detalhes do serviço.
    2. Exiba métricas de integridade gerais do serviço, juntamente com incidentes, alertas e mudanças relacionados. Se uma das métricas parecer não íntegro, navegue até a guia Observabilidade.
    3. Veja métricas de serviço mais detalhadas, bem como informações de entidades relacionadas, para iniciar a investigação de causa raiz. Ao descobrir que o problema está mais abaixo da pilha do sistema, identifique a propriedade dessa entidade para iniciar a correção.

    Benefícios do Observabilidade de serviços

    Benefício Recurso Usuários
    Centralize sinais críticos e faça a ponte de fluxos de trabalho para aumentar a agilidade e a confiabilidade:
    • Conecte dados de APMs externos
    • Mapeie esses dados para CMDBserviços
    • Exibir dados combinados no SOW
    . Administradores
    Aumente a eficiência e reduza o tempo médio de resolução (MTTR) exibindo métricas combinadas de entidades associadas a um serviço para determinar o raio de explosão e a propriedade de um incidente. Exibir métricas de integridade do serviço Operadores
    Veja mudanças relacionadas ao sistema e alertas associados a um serviço em um só lugar. Exibir a integridade geral do serviço. Operadores