클러스터링 솔루션에 대한 HDBSCAN 구성

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 읽기2분
  • HDBSCAN(Hierarchical Density Based Spatial Clustering of Applications with Noise) 인코딩을 클러스터링 솔루션에 적용하는 것이 좋습니다. K-평균은 디폴트 군집화 알고리즘입니다.

    시작하기 전에

    주:
    ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있는지, 기술이 제공하는 이점을 활용할 수 있는 사용 사례가 있는지 확인합니다. 자세한 내용은 https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847 문서를 참조하십시오.
    • 클러스터링 솔루션 정의를 생성하거나 기존 정의를 사용합니다.
    • 필요한 역할: admin 또는 ml_admin

    이 태스크 정보

    HDBSCAN 알고리즘을 적용하여 시스템이 클러스터에 할당되지 않은 데이터 샘플을 식별하는 데 도움을 줄 수 있습니다. 예를 들어, 주제 검색을 지원하기 위해 HDBSCAN을 적용할 수 있습니다.

    예측 인텔리전스는 클러스터링 프레임워크에서 기본적으로 k-means 알고리즘을 사용합니다. HSBSCAN은 DBSCAN 알고리즘과 유사한 또 다른 클러스터링 알고리즘으로, 최소 크기의 클러스터에서 작동하며 보다 안정적이고 지속적인 클러스터를 제공하는 데 도움이 될 수 있습니다. HDBSCAN의 작동 방식에 대한 요약은 이 문서를 참조하세요. DBSCAN과 HDBSCAN을 비교하려면 이 문서이 문서를 참조하세요.

    주:
    HDBSCAN으로 학습된 클러스터링 솔루션은 클러스터 업데이트를 지원하지 않습니다. 이러한 솔루션에 대한 업데이트가 실패하고 솔루션이 ml_cluster_detail_table에 기록되지 않습니다. 클러스터 업데이트를 사용하도록 설정하려면 DBSCAN 또는 k-means 학습 방법을 사용합니다.

    프로시저

    1. 다음으로 이동 모두 > 예측 인텔리전스 > 클러스터링 > 솔루션 정의.
      새 클러스터링 솔루션 정의를 생성하는 클러스터링 정의 목록 뷰로 가는 예측 인텔리전스 탐색 경로입니다.
    2. 새로 만들기를 클릭합니다.
    3. 새 클러스터링 솔루션 정의 양식을 만들거나 기존 클러스터링 솔루션 정의 양식을 사용합니다.
      이 예시 시나리오에서는 아래 이미지와 같이 hdbscan-sf 클러스터링 정의 양식을 만듭니다. 다음과 같이 필드를 구성합니다.
      • 레이블: hdbscan-sf
      • 단어 뭉치: incident_wc 또는 인시던트 기록 데이터가 있는 다른 단어 말뭉치입니다.
      • 테이블: 인시던트 [incident]
      • 필드: 간단한 설명
      • 업데이트 빈도: 업데이트 안 함
      • 스톱 워드: 기본 영어 스톱 워드
      • 교육 빈도: 30일마다
      • 처리 언어: 영어
      DBSCAN 매개변수를 적용할 클러스터링 솔루션 정의 예시
    4. Submit & Train을 클릭합니다.
    5. 교육된 양식의 관련 링크 섹션에 있는 고급 솔루션 설정 탭의 선택기에서 솔루션 매개변수를 선택한 후 신규를 클릭합니다.
      매개 변수를 만들기 위해 솔루션 매개 변수 옵션을 선택하는 방법입니다.
    6. 매개변수 기록을 생성합니다.
      1. 솔루션 매개변수 필드에서 검색 아이콘을 클릭합니다.
      2. [ML Solution Parameters] 화면에서 [Use HDBSCAN for clustering]을 선택합니다.
        검색 단추를 선택한 다음 HDBSCAN 키의 간단한 설명을 선택하여 매개변수 기록을 생성하는 방법입니다.
    7. 제출을 클릭합니다.
      HDBSCAN 알고리즘이 기록에 적용된 고급 솔루션 설정 기록이 나타납니다.
      방금 할당한 값에서 생성하는 새 솔루션 매개변수 기록입니다.
    8. 제출을 클릭합니다.
      결과: HDBSCAN이 클러스터링 솔루션에 맞게 구성되었습니다. 솔루션 매개변수는 클러스터링 솔루션 정의 양식의 고급 솔루션 설정 탭에 나타납니다.
      생성한 레코드를 제출하면 HDBSCAN 솔루션 매개변수가 클러스터링 솔루션 정의 양식에 나타납니다.