자동 경보 그룹화
자동 경보 그룹화는 기록 데이터를 사용하여 유사한 경보를 그룹으로 자동 구성하는 프로세스입니다. 이러한 경고는 서버 오류 또는 네트워크 중단과 같은 시스템 문제일 수 있습니다. 관련 경보를 함께 그룹화하여 팀이 신속하게 패턴을 식별하고, 반복되는 문제를 관리하고, 너무 많은 개별 경보로 인한 노이즈를 줄이는 데 도움이 됩니다.
도시의 교통 시스템을 모니터링하고 있다고 상상해 보십시오. 사고, 교통 체증 및 도로 폐쇄에 대한 보고와 같은 많은 경고를 받습니다. 자동 경보 그룹화는 패턴을 기반으로 이러한 경보를 구성하는 스마트 어시스턴트처럼 작동하므로 관련 문제를 함께 확인하고 보다 효율적으로 대응할 수 있습니다. 이러한 자동 경보 그룹은 고속 목록 .서비스 운영 작업 공간
이 그룹화를 활성화하려면 어떻게 해야 합니까?
경보 상관 관계에 대해 머신 러닝 기반 자동화를 사용하려면 ML 기반 자동화 상관 관계 사용 (sa_analytics.specific_patterns_enabled) 속성을 true로 설정합니다.
Domain Support - Domain Extensions Installer가 활성화되면 sa_analytics.agg.learner_domain_level 속성에 정의된 도메인 수준에 따라 경보 집계 패턴이 생성됩니다. 기본적으로 이 도메인 수준은 도메인 계층 구조의 두 번째 수준에 해당하는 2로 설정됩니다. 예를 들어 회사에서 수준 1은 회사 자체를 나타내고 수준 2는 회사 내의 부서 또는 팀을 나타낼 수 있습니다. 경보는 부서 또는 팀별로 정렬하는 것처럼 이 두 번째 수준에 따라 그룹화됩니다. 자세한 내용은 도메인 분리 및 이벤트 관리.
작동 원리
자동 경보 그룹화는 머신 러닝(ML) 및 기록 데이터를 사용하여 경보 간의 패턴을 식별합니다. 유사한 기간 내에 여러 번 발생한 문제 유형, 영향을 받는 시스템, CI 또는 메트릭과 같은 패턴 식별자라는 특정 특성을 살펴보고 경보가 서로 관련이 있는지 확인합니다. 경보 집계 학습자는 알고리즘을 사용하여 패턴을 기반으로 경보를 그룹화합니다. 특히 패턴 기반 알고리즘과 확률적 방법을 사용하여 수신 경보를 분석하고 관련 경보를 식별합니다.
- 기록 데이터 분석: 시스템은 과거 경보를 연구하여 패턴과 관계를 학습합니다.
- 머신 러닝 적용: ML 알고리즘은 기록 경보 데이터를 분석하여 경보 간의 패턴과 관계를 식별합니다. 이를 통해 시스템은 과거 인시던트로부터 학습하고 시간이 지남에 따라 유사한 경보를 함께 그룹화하는 기능을 개선할 수 있습니다.
- 유사한 경보 그룹화: 일치하는 패턴이 있는 경보는 자동으로 함께 그룹화됩니다.
- 오전 8:00: 메인 스트리트에서 사고
- 오전 8시 5분: 메인 스트리트 근처의 교통 체증
- 오전 8시 10분: 메인 스트리트 도로 폐쇄
복지
- 반복되는 문제 찾기: 패턴(예: 서버가 지속적으로 과열됨)을 빠르게 파악합니다.
- 시간 절약: 개별 경보 대신 관련 경보 그룹을 처리합니다.
- 대응 개선: 분산된 문제를 처리하는 대신 근본 원인을 해결하는 데 집중합니다.