Algoritmo de detecção de anomalia

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 2 min. de leitura
  • O observador de instância está realizando a detecção de anomalias por meio do modelo estatístico de pontuação Z, também conhecido como método univariado.

    A detecção de anomalias analisa um conjunto de cinco métricas, Memória máxima, média do semáforo, tempo de resposta do SQL, tempo de resposta do servidor e contagem de transações. O modelo de detecção foi validado com amostragens com várias instâncias de dados diários, semanais e mensais.

    As métricas que representam anomalias usando o modelo de pontuação Z são Contagem de transações, Tempo de resposta do servidor e Tempo de resposta do SQL. As métricas que representam anomalias usando uma abordagem baseada em limite superior são Média do semáforo, Memória máxima do nó e Execução de trabalho. Consulte Introdução aos Gráficos de desempenho para obter detalhes sobre as cinco métricas.

    Metodologia baseada em limite superior

    A metodologia baseada em limite superior usa métricas com um limite exaustivo. Por exemplo, a métrica A, que tem um valor médio de semáforo de 14 ou 16, que é usada na plataforma para limitar o número de transações que podem ocorrer em um nó de uma só vez para proteger recursos no nó. Memória máxima de 2 GB, em que cada memória de nó tem uma capacidade máxima predefinida. Em todos esses casos semelhantes, a situação é alarmante somente quando as métricas estão mais próximas do limite de exaustão. Mesmo que o desvio seja maior do que a média, mas menor do que o limite de exaustão, o limite não resultaria em um alarme.

    Metodologia de pontuação Z

    Uma pontuação Z é uma medida numérica que descreve o relacionamento entre um valor e a média de um grupo de valores. A pontuação Z é medida em termos de desvios padrão da média. Se uma pontuação Z for 0, a pontuação do ponto de dados será idêntica à pontuação média.

    A fórmula para calcular uma pontuação Z é (x-μ)/σ :

    • x A pontuação bruta dos dados, como a média móvel dos 15 minutos anteriores
    • μ : A população de dados significa que é a média das quatro semanas anteriores no mesmo dia, mesma hora e mesmo minuto
    • σ Desvio padrão da população de dados
    Ao calcular pontuações Z ou fazer comparações, é essencial considerar esses padrões dos dados analisados com padrões cíclicos inerentes. A ciclicidade em um conjunto de dados se refere a padrões repetidos que ocorrem em intervalos regulares, como ciclos diários, semanais ou sazonais. Por exemplo, os dados de vendas podem exibir valores mais altos durante as épocas de férias ou valores mais baixos durante períodos fora de pico.

    A pontuação de ciclicidade é a semelhança entre duas séries que medem a semelhança entre dois vetores e ajuda a garantir que o modelo de pontuação Z forneça informações confiáveis e identifique anomalias verdadeiras ou discrepantes, considerando os padrões naturais dos dados.

    A pontuação cíclica é calculada no nível da instância com uma seleção de dados de quatro semanas dividida em incrementos de vetor de duas semanas, excluindo finais de semana. A pontuação retorna a pontuação de semelhança entre os dois, em que uma pontuação mais alta indica uma tendência de semelhança mais alinhada nos dados do vetor comparado.