변칙 탐지 알고리즘

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 읽기2분
  • 인스턴스 관찰자는 일변량 방법이라고도 하는 Z-점수 통계 모델을 통해 예외 탐지를 수행합니다.

    예외 탐지는 최대 메모리, 세마포 평균, SQL 응답 시간, 서버 응답 시간 및 트랜잭션 수의 5가지 메트릭 세트를 분석합니다. 탐지 모델은 일별, 주별 및 월별 수준 데이터의 여러 인스턴스가 있는 샘플링으로 확인되었습니다.

    Z-점수 모델을 사용하여 변칙을 나타내는 메트릭은 트랜잭션 수, 서버 응답 시간 및 SQL 응답 시간입니다. 상한 임계치 기반 접근 방식을 사용하여 예외를 나타내는 메트릭은 세마포 평균, 노드 최대 메모리 및 작업 실행입니다. 다섯 가지 메트릭에 대한 자세한 내용은 를 성능 차트 시작하기 참조하십시오.

    상한 임계치 기반 방법론

    상한 임계치 기반 방법론은 소진 제한이 있는 메트릭을 사용합니다. 예를 들어, 세마포 평균 값이 14 또는 16인 메트릭 A는 플랫폼에서 노드의 리소스를 보호하기 위해 노드에서 한 번에 발생할 수 있는 트랜잭션 수를 제한하는 데 사용됩니다. 메트릭 B, 메모리 최대 2GB, 각 노드 메모리에 미리 정의된 최대 용량이 있습니다. 이러한 모든 유사한 사례에서 상황은 메트릭이 소진 한계에 가까워질 때만 우려됩니다. 편차가 평균보다 높지만 소진 한계보다 낮더라도 임계값 한계로 인해 경보가 발생하지 않습니다.

    Z-점수 방법론

    Z-점수는 값과 값 그룹의 평균 간의 관계를 설명하는 숫자 측정값입니다. Z-점수는 평균과의 표준 편차로 측정됩니다. Z-점수가 0이면 데이터 요소 점수는 평균 점수와 동일합니다.

    Z-점수를 계산하는 공식은 z = (x-μ)/σ입니다.

    • x : 이전 15분 동안의 이동 평균으로서 데이터의 원시 점수
    • μ: 데이터 모집단은 같은 요일, 같은 시간, 같은 분에 대한 이전 4주의 평균을 의미합니다.
    • σ: 데이터 모집단 표준 편차
    Z-점수를 계산하거나 비교할 때 분석된 데이터의 이러한 패턴과 고유한 순환 패턴을 고려하는 것이 중요합니다. 데이터 세트의 주기성은 매일, 매주 또는 계절적 주기와 같이 정기적으로 발생하는 반복 패턴을 나타냅니다. 예를 들어 판매 데이터는 연휴 기간에는 더 높은 값을 나타내고 비수기에는 더 낮은 값을 나타낼 수 있습니다.

    순환성 점수는 두 벡터 간의 유사성을 측정하는 두 계열 간의 유사성으로, Z-점수 모델이 신뢰할 수 있는 통찰력을 제공하고 데이터의 자연 패턴을 고려하면서 실제 예외 또는 이상값을 식별하도록 하는 데 도움이 됩니다.

    순환 점수는 인스턴스 수준에서 계산되며, 4주간의 데이터 선택을 주말을 제외한 2주간의 벡터 증분으로 나누어 계산합니다. 점수는 둘 사이의 유사성 점수를 반환하며, 점수가 높을수록 비교된 벡터 데이터에서 더 정렬된 유사성 추세를 나타냅니다.