Instance Observer의 경보
ServiceNow Instance Observer는 플랫폼 상태, 성능 및 사용자 경험을 모니터링하도록 설계된 포괄적인 경보 세트를 제공합니다. 이러한 경보는 쉽게 사용하고 실행할 수 있도록 분류됩니다.
- 트랜잭션
- 다음과 같은 성능의 변칙, 급증 또는 저하에 대한 애플리케이션 트랜잭션을 모니터링합니다.
- 트랜잭션 감소: 총 트랜잭션 볼륨의 감소를 감지합니다.
- 트랜잭션 감소 노드: 노드당 트랜잭션 볼륨 감소를 식별합니다.
- 트랜잭션 증가: 예기치 않은 트랜잭션 급증에 플래그를 지정합니다.
- 트랜잭션 증가 노드: 노드 수준 트랜잭션 스파이크를 강조 표시합니다.
- 응답 시간: 시스템 전체 응답 시간이 증가할 때 트리거됩니다.
- 응답시간 노드: 응답시간이 저하된 노드에 플래그를 지정합니다.
- 데이터베이스 응답시간: 트랜잭션에 영향을 주는 데이터베이스 수준 대기 시간을 모니터링합니다.
- 초당 느린 쿼리 수: 응답성에 영향을 주는 느린 데이터베이스 쿼리의 양을 식별합니다.
- 노드 상태(CPU, 메모리 또는 가비지 수집)
- 병목현상 또는 장애를 방지하기 위해 노드 인프라 상태를 추적합니다.
- 노드 CPU 시간: 노드에 대한 높은 CPU 사용량 경고
- 노드 메모리: 메모리 소비 패턴을 모니터링합니다.
- 노드 가비지 수집 시간: JVM GC 지연 추적
- 부하 분산 장치 컨테이너 CPU 사용률: LB 컨테이너의 CPU 오버로드에 플래그를 지정합니다.
- 부하 분산 장치 컨테이너 메모리 사용률: LB 컨테이너에서 메모리 소모를 감지합니다
- 데이터베이스 성능 및 상태
- 쿼리 상태 및 데이터 안정성을 확인하기 위해 중요한 데이터베이스 표시기를 다룹니다.
- 데이터베이스 호스트 상태 CPU: 기본 DB 호스트의 높은 CPU
- 샤드 호스트 상태 CPU: 샤드 호스트의 리소스 문제
- 읽기 복제본 호스트 상태(CPU): 읽기 복제본 CPU 이상
- 대기 복제 지연: 대기 DB 복제 지연
- InnoDB 행 잠금: 행 잠금 대기 빈도
- 기본 데이터베이스 증가: 기본 DB의 비정상적인 증가에 플래그를 지정합니다.
- 데이터베이스 테이블 증가: 특정 테이블 수준 성장 지표
- 인바운드 및 아웃바운드 이메일
- 이메일 기반 커뮤니케이션의 적시 제공 및 수집을 촉진합니다.
- 아웃바운드 이메일: 아웃바운드 이메일 처리 지연 또는 실패
- 인바운드 이메일: 수신 이메일 수집 문제
- 스케줄러 및 작업 실행
- 작업 실행 수명주기에서 문제를 감지하는 데 도움이 됩니다.
- 스케줄러 멈춤: 스케줄러가 진행되지 않거나 차단됨
- 장기 실행 작업: 일반 런타임을 초과하는 작업
- 특정 장기 실행 작업: 사용자 지정 작업 모니터링
- 스레드 실행 중: 비정상적으로 길거나 대량으로 실행되는 스레드
- 세션 및 사용자 활동
- 인스턴스 및 노드 전반에서 사용자 로그인 동작을 추적합니다.
- 사용자 세션 로그인 – 인스턴스: 인스턴스 간 로그인 활동
- 사용자 세션 로그인됨 – 노드: 노드별 세션 메트릭
- 이벤트 큐 및 세마포어 관리
- 플랫폼 이벤트 처리 및 작업 실행 제한을 디버깅하는 데 중요:
- 기본 세마포어 평균: 세마포 대기 시간 추세
- 기본 세마포어 QDepth: 큐에 대기 중인 세마포어 요청의 깊이
- 통합 세마포어: 통합 세마포어 경합 모니터링
- 이벤트 큐 확인: 이벤트 큐의 백로그를 추적합니다.
- 이벤트에 대한 특정 큐: 사용자 지정 이벤트 큐 모니터링
- 높은 우선순위 이벤트 큐: 미션 크리티컬 이벤트 큐를 모니터링합니다.
- ECC 큐: 외부 통신 채널 백로그 경보
- 비동기 메시징 버스(AMB)
- 실시간 앱 동작에 대한 내부 메시징 버스 관측 가능성:
- AMB 전송 큐 깊이: 보내는 메시지 큐의 크기
- 사용 중인 AMB 전송: AMB 전송 용량 사용률
- 이력 또는 목록 데이터 볼륨
- 성능에 영향을 줄 수 있는 이력 또는 목록 데이터의 증가를 모니터링합니다.
이력 목록 길이: 이력 테이블의 과도한 기록 수에 플래그를 지정합니다.
- 애플리케이션 호스트 상태
- 애플리케이션 계층에서 상태를 모니터링합니다.
애플리케이션 호스트 상태 CPU: 애플리케이션 계층 CPU 오버로드 경고입니다.
- AI/ML 또는 지능형 경보
- AI/ML 기반 동작 분석을 통해 생성된 경보를 포함합니다.
Auriga Intelligent: AI 기반 예외 또는 패턴 탐지 경보입니다.