클러스터링 솔루션에 대한 Connect 구성요소 알고리즘 및 Levenshtein Distance 방법 구성
Configure Connect Component 및 Levenshtein Distance 메서드 인코딩을 적용하여 클러스터링 솔루션에 대한 학습을 최적화합니다.
시작하기 전에
주:
ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있는지, 기술이 제공하는 이점을 활용할 수 있는 사용 사례가 있는지 확인합니다. 자세한 내용은 https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847 문서를 참조하십시오.
- 클러스터링 솔루션 정의를 생성하고 교육하거나 기존 정의를 사용합니다.
- 필요한 역할: admin 또는 ml_admin
이 태스크 정보
클러스터링 솔루션을 교육할 때 다음 세 가지 옵션이 있습니다.
- 디폴트 k-평균 알고리즘을 사용합니다.
- 유클리드 거리 방법과 함께 선택적 DBSCAN 솔루션 매개변수를 메트릭으로 사용합니다.
- 선택적 DBSCAN, 최소 이웃 및 Levenshtein 거리 솔루션 매개 변수를 사용합니다. Connect 구성 요소는 DBSCAN 및 최소 인접 항목에 의해 활성화되며 단락 벡터 기반 텍스트와 Levenshtein 거리 기반 텍스트를 모두 지원합니다. Levenshtein Distance 메서드를 사용하여 솔루션을 학습하는 경우 클러스터링 솔루션에서 단어 말뭉치를 사용할 필요가 없습니다.
이 예제 시나리오에서는 위에서 언급한 세 번째 옵션을 사용하여 솔루션 정의를 학습시킵니다.