클러스터링 솔루션을 위한 HDBSCAN 구성
HDBSCAN(Hierarchical Density Based Spatial Clustering of Applications with Noise) 인코딩을 클러스터링 솔루션에 적용하는 것이 좋습니다. K-평균은 디폴트 군집화 알고리즘입니다.
시작하기 전에
주:
ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있는지, 기술이 제공하는 이점을 활용할 수 있는 사용 사례가 있는지 확인합니다.
- 클러스터링 솔루션 정의를 생성하거나 기존 정의를 사용합니다.
- 필요한 역할: admin 또는 ml_admin
이 태스크 정보
HDBSCAN 알고리즘을 적용하여 시스템이 클러스터에 할당되지 않은 데이터 샘플을 식별하는 데 도움을 줄 수 있습니다. 예를 들어 HDBSCAN을 적용하여 주제 검색을 지원할 수 있습니다.
Predictive Intelligence는 클러스터링 프레임워크에서 기본적으로 k-means 알고리즘을 사용합니다. HSBSCAN은 DBSCAN 알고리즘과 유사한 또 다른 클러스터링 알고리즘으로, 최소 크기의 클러스터에서 작동하며 보다 안정적이고 지속적인 클러스터를 제공하는 데 도움이 될 수 있습니다. HDBSCAN 작동 방식에 대한 요약은 이 문서를 참조하세요. DBSCAN과 HDBSCAN을 비교하려면 이 문서 와 이 문서를 참조하세요.
주:
HDBSCAN으로 교육된 클러스터링 솔루션은 클러스터 업데이트를 지원하지 않습니다. 이러한 솔루션에 대한 업데이트가 실패하고 솔루션이 ml_cluster_detail_table에 기록되지 않습니다. 클러스터 업데이트를 사용하도록 설정하려면 DBSCAN 또는 k-means 학습 방법을 사용합니다.