Algoritmo de detecção de anomalias

  • Versão de lançamento: Xanadu
  • Atualizado 1 de ago. de 2024
  • 2 min. de leitura
  • O Observador de instância está executando a detecção de anomalias por meio do modelo estatístico Z-score, também chamado de método univariado.

    A detecção de anomalias analisa um conjunto de cinco métricas: Máximo de memória, Média de semáforos, Tempo de resposta do SQL, Tempo de resposta do servidor e Contagem de transações. O modelo de detecção foi validado com amostras com várias instâncias de dados de nível diário, semanal e mensal.

    As métricas que representam anomalias usando o modelo de pontuação Z são Contagem de transações, Tempo de resposta do servidor e Tempo de resposta do SQL. As métricas que representam anomalias usando uma abordagem baseada em limite superior são Média de semáforo, Memória máxima de nó e Execução de trabalho. Consulte Introdução aos gráficos de desempenho para obter detalhes sobre as cinco métricas.

    Metodologia baseada em limite superior

    A metodologia baseada em limite superior usa métricas com um limite exaustivo. Por exemplo, a métrica A, que tem um valor médio de semáforo de 14 ou 16, que é usada na plataforma para limitar o número de transações que podem ocorrer em um nó de uma vez para proteger os recursos no nó. Métrica B, memória máxima de 2 GB, em que cada memória de nó tem uma capacidade máxima predefinida. Em todos esses casos semelhantes, a situação é alarmante somente quando as métricas estão mais próximas do limite de esgotamento. Mesmo que o desvio seja maior que a média, mas menor que o limite de esgotamento, o limite não resultará em um alarme.

    Metodologia de pontuação Z

    Uma pontuação Z é uma medida numérica que descreve o relacionamento entre um valor e a média de um grupo de valores. A pontuação Z é medida em termos de desvios padrão da média. Se uma pontuação Z for 0, a pontuação do ponto de dados será idêntica à pontuação média.

    A fórmula para calcular uma pontuação Z é z = (x-µ)/σ:

    • x : a pontuação bruta dos dados, como a média móvel dos últimos 15 minutos
    • µ: a média de preenchimento de dados é a média das quatro semanas anteriores no mesmo dia, na mesma hora e no mesmo minuto
    • σ: o desvio padrão de preenchimento de dados
    Ao calcular pontuações Z ou fazer comparações, é essencial considerar esses padrões dos dados analisados com padrões cíclicos inerentes. A ciclicidade em um conjunto de dados se refere a padrões de repetição que ocorrem em intervalos regulares, como ciclos diários, semanais ou sazonais. Por exemplo, os dados de vendas podem exibir valores mais altos durante as temporadas de férias ou valores mais baixos durante os períodos fora de pico.

    A pontuação de ciclicidade é a semelhança entre duas séries que medem a semelhança entre dois vetores e ajuda a garantir que o modelo de pontuação Z forneça informações confiáveis e identifique verdadeiras anomalias ou valores atípicos, considerando os padrões naturais dos dados.

    A pontuação cíclica é calculada no nível da instância com uma seleção de dados de quatro semanas dividida em incrementos vetoriais de duas semanas, excluindo fins de semana. A pontuação retorna a pontuação de semelhança entre os dois, em que uma pontuação mais alta indica uma tendência de semelhança mais alinhada nos dados vetoriais comparados.