Explorando Inteligência para métricas

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 2 min. de leitura
  • Saiba mais sobre como usar Inteligência para métricaspara analisar dados de métrica e identificar anomalias.

    Visão geral Inteligência para métricas

    Inteligência para métricas ajuda a identificar e evitar possíveis indisponibilidades de serviço. Com base em dados de métrica histórica, Inteligência para métricasIndica o comportamento anômalo de ICs que os eventos podem não capturar.

    Inteligência para métricas usuários

    Tabela 1. Usuários
    Usuário Descrição
    Usuário da Gestão de eventos

    [evt_mgmt_user]

    Pode exibir alertas e suas métricas subjacentes.
    Administrador do Gestão de eventos

    [evt_mgmt_admin]

    Pode definir todas as definições de métrica e configurações do conector.
    Operador

    [evt_mgmt_operator]

    Pode exibir todas as definições de métrica e configurações do conector.

    Fluxo de trabalho do Inteligência para métricas

    A ilustração a seguir descreve o layout e o fluxo de dados no Inteligência para métricasaplicação.

    Figura 1. Pipeline de Inteligência de métrica
    Infográfico que descreve o fluxo de trabalho de Inteligência de métrica
    1. Coleta de dados: Agentes, conectores de terceiros e conectores personalizados (REST) coletam dados de desempenho de servidores e componentes de infraestrutura. Os dados coletados pelos agentes são passados para o. MID ServerPor meio do WebSocket, e os dados coletados por conectores personalizados e de terceiros são passados para o. MID ServerPor meio do conector.
    2. Normalização de dados: Os dados brutos são formatados pelo normalizador para torná-los legíveis para a base de métrica.
    3. Agrupamento de dados: Os dados são agrupados pelo Batedor e enviados para a REST API na instância (Glide).
    4. Transferência de dados para o Clotho TSDB: REST API processa dados e os envia para o Clotho TSDB.
    5. Criação do modelo: O trabalho Instrutor/Aluno é executado e cria um modelo com base nos dados recebidos. Por exemplo, o trabalho pode descobrir que o limite para uso normal da CPU é de 60%. Um novo modelo é criado todos os dias, com base nos dados desse dia junto com os dados anteriores (a maioria dos modelos coleta dados dos últimos 14 dias).
    6. Transferência de dados do modelo para o banco de dados de cache do modelo de série temporal: Os dados são enviados para o banco de dados de cache do modelo de série temporal no MID ServerPor meio da instância (Glide). O cache do modelo armazena os limites do modelo "Normal".
    7. Detecção de anomalia: Os dados fora dos limites do normal são detectados pelo MID Servere é renderizado com uma pontuação de anomalia. As anomalias são armazenadas na instância e exibidas no Espaço de operações de serviços. A detecção de anomalias é realizada em tempo real, para que os clientes sejam informados imediatamente sobre anomalias.

    Benefícios das Inteligência para métricas

    Benefício Recurso Usuários
    Monitore a integridade, o desempenho e a disponibilidade do seu sistema por meio da coleta automatizada de eventos e métricas, aproveitando configurações automatizadas. Monitoramento do Agent Client Collector Operador de NOC, Gestão de eventosadministrador
    Reduza o ruído promovendo apenas as anomalias mais significativas.

    Exibir alertas de anomalia

    Criar regras de métrica

    Administrador do Gestão de eventos
    Detecte anomalias com a detecção de anomalias baseada em IA, seja com detecção de padrão anormal de aprendizado de máquina não supervisionado (sem intervenção do usuário) ou definindo regras de alerta determinísticas (definindo manualmente um limite estático). Como Análise de logs de integridadegera alertas Administrador do Gestão de eventos
    Melhore o tempo de resolução em alertas e incidentes em aberto com a visualização de dados brutos de métrica. Explorador de métrica Operador de NOC, Gestão de eventosadministrador