메트릭 인텔리전스 탐색

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 30일
  • 소요 시간: 2분
  • 메트릭 데이터를 분석하고 예외를 식별하는 데 사용하는 메트릭 인텔리전스 방법에 대해 자세히 알아보십시오.

    메트릭 인텔리전스 개요

    메트릭 인텔리전스 잠재적인 서비스 중단을 식별하고 방지하는 데 도움이 됩니다. 기록 메트릭 데이터를 메트릭 인텔리전스 기반으로 이벤트에서 캡처하지 못할 수 있는 CI의 예외 동작을 나타냅니다.

    메트릭 인텔리전스 사용자

    표 1. 사용자
    사용자 설명
    이벤트 관리 사용자

    [evt_mgmt_user]

    경보와 경보의 기본 메트릭을 볼 수 있습니다.
    이벤트 관리 관리자

    [evt_mgmt_admin]

    모든 메트릭 정의 및 커넥터 설정을 구성할 수 있습니다.
    운영자

    [evt_mgmt_operator]

    모든 메트릭 정의와 커넥터 설정을 볼 수 있습니다.

    메트릭 인텔리전스 워크플로우

    다음 그림은 메트릭 인텔리전스 애플리케이션 내의 레이아웃 및 데이터 흐름을 보여 줍니다.

    그림 1. 메트릭 인텔리전스 파이프라인
    메트릭 인텔리전스 워크플로우를 개괄하는 인포그래픽
    1. 데이터 수집: 에이전트, 타사 커넥터 및 REST(사용자 지정 커넥터)는 서버 및 인프라 구성요소에서 성능 데이터를 수집합니다. 에이전트가 수집한 데이터는 WebSocket을 통해 전달 MID 서버 되고, 외부 공급업체 및 사용자 지정 커넥터 MID 서버 에서 수집한 데이터는 커넥터를 통해 전달됩니다.
    2. 데이터 표준화: 원시 데이터는 메트릭 기준에서 읽을 수 있도록 표준화기에 의해 형식이 지정됩니다.
    3. 데이터 그룹화: 데이터는 배치 관리자에 의해 그룹화되고 인스턴스(Glide)의 REST API로 전송됩니다.
    4. Clotho TSDB로의 데이터 전송: REST API는 데이터를 처리하여 Clotho TSDB로 보냅니다.
    5. 모델 생성: 트레이너/학습자 작업이 실행되고 수신된 데이터를 기반으로 모델을 생성합니다. 예를 들어 이 작업은 정상 CPU 사용량에 대한 임계치가 60%임을 학습할 수 있습니다. 그날의 데이터와 과거 데이터를 기반으로 매일 새 모델이 생성됩니다(대부분의 모델은 지난 14일 동안의 데이터를 수집함).
    6. 시계열 모델 캐시 DB로의 모델 데이터 전송: 인스턴스(Glide)를 통해 데이터가 시계열 모델 캐시 DB MID 서버 로 전송됩니다. 모델 캐시는 '일반' 모델의 범위를 저장합니다.
    7. 예외 탐지: 정상 범위를 벗어난 데이터는 에서 MID 서버 탐지되고 예외 점수로 렌더링됩니다. 예외는 인스턴스에 저장되며 서비스 운영 작업 공간. 예외 탐지는 실시간으로 수행되므로 고객은 예외를 즉시 인지할 수 있습니다.

    메트릭 인텔리전스 이점

    이점 기능 사용자
    자동화된 구성을 활용하여 이벤트 및 메트릭의 자동화된 수집을 통해 시스템의 상태, 성능 및 가용성을 모니터링합니다. 에이전트 클라이언트 수집기 모니터링 NOC 운영자, 이벤트 관리 관리자
    가장 의미 있는 예외만 승격하여 노이즈를 줄입니다.

    예외 경보 보기

    메트릭 규칙 만들기

    이벤트 관리 관리자
    자율 머신 러닝 비정상적인 패턴 탐지(사용자 개입 없음) 또는 결정론적 경보 규칙 설정(정적 임계치를 수동으로 설정)하여 AI 기반 예외 탐지를 사용하여 예외를 탐지합니다. 상태 로그 분석가 경보를 생성하는 방법 이벤트 관리 관리자
    원시 메트릭 데이터 시각화를 통해 오픈 경보 및 인시던트의 해결 시간을 단축합니다. 메트릭 탐색기 NOC 운영자, 이벤트 관리 관리자