예외 탐지 알고리즘

워싱턴 DC 임팩트

Release

washingtondc

ft:locale

ko-KR

ft:publication_title

워싱턴 DC 임팩트

ft:clusterId

ipact

bundleId

ipact

예외 탐지 알고리즘

릴리스 버전: Washingtondc

업데이트 날짜 2024년 02월 01일

읽기2분

인스턴스 관찰자는 일변량 방법이라고도 하는 Z-점수 통계 모델을 통해 예외 검색을 수행합니다.

예외 탐지는 메모리 최대, 세마포 평균, SQL 응답 시간, 서버 응답 시간 및 트랜잭션 수라는 5가지 메트릭 집합을 분석합니다. 검색 모델은 일별, 주별 및 월별 수준 데이터의 여러 인스턴스가 있는 샘플링을 통해 유효성이 검사되었습니다.

Z-점수 모델을 사용하여 예외를 나타내는 메트릭은 트랜잭션 수, 서버 응답 시간 및 SQL 응답 시간입니다. 상한 임계치 기반 접근 방식을 사용하여 예외를 나타내는 메트릭은 세마포 평균, 노드 최대 메모리 및 작업 실행입니다. 5가지 메트릭에 대한 자세한 내용은 을 참조하십시오 성능 차트 시작하기 .

상한 임계값 기반 방법론

상한 임계치 기반 방법론은 소진 한계가 있는 메트릭을 사용합니다. 예를 들어 세마포 평균 값이 14 또는 16인 메트릭 A는 플랫폼에서 노드의 리소스를 보호하기 위해 노드에서 한 번에 발생할 수 있는 트랜잭션 수를 제한하는 데 사용됩니다. 메트릭 B, 메모리 최대 2GB, 각 노드 메모리에 미리 정의된 최대 용량이 있습니다. 이러한 모든 유사한 사례에서 상황은 메트릭이 소진 한계에 더 가까울 때만 놀랍습니다. 편차가 평균보다 높지만 소진 한계보다 낮더라도 임계값 한계로 인해 경보가 발생하지 않습니다.

Z-점수 방법론

Z-점수는 값과 값 그룹의 평균 간의 관계를 설명하는 숫자 측정입니다. Z-점수는 평균과의 표준 편차로 측정됩니다. Z-점수가 0이면 데이터 요소 점수는 평균 점수와 동일합니다.

Z-점수를 계산하는 공식은 z = (x-μ)/σ입니다.

x : 이전 15분 동안의 이동 평균으로서 데이터의 원시 점수
μ: 데이터 모집단의 평균은 이전 4주 동안 같은 날, 같은 시간, 같은 분에 대한 평균입니다
σ: 데이터 모집단 표준 편차

Z-점수를 계산하거나 비교할 때 분석된 데이터의 이러한 패턴을 고유 주기적 패턴으로 고려하는 것이 중요합니다. 데이터 세트의 주기성은 매일, 매주 또는 계절 주기와 같이 정기적으로 발생하는 반복 패턴을 나타냅니다. 예를 들어 판매 데이터는 연휴 기간에는 더 높은 값을 나타내거나 사용량이 적은 기간에는 더 낮은 값을 나타낼 수 있습니다.

주기성 점수는 두 벡터 간의 유사성을 측정하는 두 계열 간의 유사성으로, Z-점수 모델이 신뢰할 수 있는 통찰력을 제공하고 데이터의 자연 패턴을 고려하면서 실제 변칙 또는 이상값을 식별하도록 하는 데 도움이 됩니다.

순환 점수는 4주간의 데이터 선택을 주말을 제외한 2주 벡터 증분으로 나눈 인스턴스 수준에서 계산됩니다. 점수는 둘 사이의 유사성 점수를 반환하며, 점수가 높을수록 비교된 벡터 데이터에서 유사성 추세가 더 정렬됨을 나타냅니다.