예외 탐지 알고리즘

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 30일
  • 읽기2분
  • Instance Observer는 일변량 방법이라고도 하는 Z-점수 통계 모델을 통해 예외 탐지를 수행합니다.

    예외 탐지는 최대 메모리, 세마포 평균, SQL 응답시간, 서버 응답시간 및 트랜잭션 수의 5가지 메트릭 세트를 분석합니다. 탐지 모델은 일별, 주별 및 월별 수준 데이터의 여러 인스턴스가 있는 샘플링을 통해 검증되었습니다.

    Z 점수 모델을 사용하여 예외를 나타내는 메트릭은 트랜잭션 수, 서버 응답시간 및 SQL 응답시간입니다. 상한 임계치 기반 접근 방식을 사용하여 예외를 나타내는 메트릭은 세마포 평균, 노드 최대 메모리 및 작업 실행입니다. 다섯 가지 지표에 대한 자세한 내용은 을 성과 차트 시작하기 참조하십시오.

    상한 임계치 기반 방법론

    상한 임계치 기반 방법론은 한계가 있는 메트릭을 사용합니다. 예를 들어, 세마포어 평균 값이 14 또는 16인 메트릭 A는 플랫폼에서 노드에서 한 번에 발생할 수 있는 트랜잭션 수를 제한하여 노드의 자원을 보호하는 데 사용됩니다. 메트릭 B, 최대 메모리 2GB, 여기서 각 노드 메모리에는 미리 정의된 최대 용량이 있습니다. 이러한 모든 유사한 경우에서 상황은 지표가 고갈 한계에 더 가까울 때만 우려됩니다. 편차가 평균보다 높지만 소모 한계보다 낮더라도 임계값 한계로 인해 경보가 발생하지 않습니다.

    Z-점수 방법론

    Z-점수는 값과 값 그룹의 평균 간의 관계를 설명하는 수치 측정값입니다. Z-점수는 평균의 표준 편차로 측정됩니다. Z-점수가 0이면 데이터 포인트 점수는 평균 점수와 동일합니다.

    Z-점수를 계산하는 공식은 z = (x-μ)/σ입니다.

    • x : 이전 15분의 이동 평균으로 표시되는 데이터의 원시 점수
    • μ: 데이터 모집단 평균은 같은 날, 같은 시간, 같은 분의 이전 4주간의 평균입니다
    • σ: 데이터 모집단 표준 편차
    Z-점수를 계산하거나 비교할 때 고유한 순환 패턴이 있는 분석된 데이터의 이러한 패턴을 고려하는 것이 중요합니다. 데이터 세트의 주기성은 매일, 매주 또는 계절 주기와 같이 일정한 간격으로 발생하는 반복 패턴을 나타냅니다. 예를 들어 판매 데이터는 휴일 시즌에 더 높은 값을 나타내거나 사용량이 적은 기간에는 더 낮은 값을 나타낼 수 있습니다.

    순환성 점수는 두 벡터 간의 유사성을 측정하는 두 계열 간의 유사성으로, Z 점수 모델이 데이터의 자연스러운 패턴을 고려하면서 신뢰할 수 있는 인사이트를 제공하고 실제 예외 또는 이상값을 식별하도록 하는 데 도움이 됩니다.

    순환 점수는 인스턴스 수준에서 계산되며, 4주간의 데이터 선택은 주말을 제외하고 2주 벡터 증분으로 나뉩니다. 점수는 둘 사이의 유사성 점수를 반환하며, 여기서 점수가 높을수록 비교된 벡터 데이터에서 유사성 추세가 더 정렬됨을 나타냅니다.