클러스터링 솔루션에 대한 Connect 구성요소 알고리즘 및 Levenshtein Distance 방법 구성

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 읽기2분
  • Configure Connect Component 및 Levenshtein Distance 메서드 인코딩을 적용하여 클러스터링 솔루션에 대한 학습을 최적화합니다.

    시작하기 전에

    필요한 역할: admin 또는 ml_admin
    주:
    ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있는지, 기술이 제공하는 이점을 활용할 수 있는 사용 사례가 있는지 확인합니다. 자세한 내용은 https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847 문서를 참조하십시오.
    • 클러스터링 솔루션 정의를 생성하고 교육하거나 기존 정의를 사용합니다.
    • 필요한 역할: admin 또는 ml_admin

    이 태스크 정보

    클러스터링 솔루션을 교육할 때 다음 세 가지 옵션이 있습니다.

    • 디폴트 k-평균 알고리즘을 사용합니다.
    • 유클리드 거리 방법과 함께 선택적 DBSCAN 솔루션 매개변수를 메트릭으로 사용합니다.
    • 선택적 DBSCAN, 최소 이웃 및 Levenshtein 거리 솔루션 매개 변수를 사용합니다. Connect 구성 요소는 DBSCAN 및 최소 인접 항목에 의해 활성화되며 단락 벡터 기반 텍스트와 Levenshtein 거리 기반 텍스트를 모두 지원합니다. Levenshtein Distance 메서드를 사용하여 솔루션을 학습하는 경우 클러스터링 솔루션에서 단어 말뭉치를 사용할 필요가 없습니다.

    이 예제 시나리오에서는 위에서 언급한 세 번째 옵션을 사용하여 솔루션 정의를 학습시킵니다.

    프로시저

    1. 다음으로 이동 모두 > 예측 인텔리전스 > 클러스터링 > 솔루션 정의.
    2. 교육된 클러스터링 솔루션 정의 양식을 엽니다.
    3. 폼의 Related Links(관련 링크) 섹션에 있는 Advanced Solution Settings(고급 솔루션 설정) 탭에서 New(새로 만들기)를 클릭합니다.
      이 이미지는 매개변수를 작성하기 위한 솔루션 매개변수 옵션을 선택하는 방법을 보여줍니다.
    4. 매개변수 기록을 생성합니다.
      1. 솔루션 매개변수 필드에서 검색 아이콘을 클릭합니다.
      2. ML 솔루션 파라미터(ML Solution Parameters) 화면에서 Levenshtein Distance(레벤슈타인 거리)를 선택합니다.
      검색 단추를 선택한 다음 Levenshtein 거리 키의 간단한 설명을 선택하여 매개변수 기록을 생성하는 방법입니다.
    5. 제출을 클릭합니다.

      고급 솔루션 설정 기록 화면이 새로 고쳐집니다.

      방금 할당한 값에서 생성하는 새 솔루션 매개변수 기록입니다.

    6. 제출을 클릭합니다.

      결과: Levenshtein Distance는 클러스터링 솔루션에 대해 구성됩니다. 솔루션 매개변수는 클러스터링 정의 양식의 고급 솔루션 설정 탭에 나타납니다.

      생성한 레코드를 제출하면 Levenshtein 거리 솔루션 매개변수가 클러스터링 솔루션 정의 양식에 나타납니다.
    7. 이전 Levenshtein 거리 예제의 1-6단계를 반복합니다. 단, 이번에는 구성 요소 연결 기능을 함께 사용하도록 설정하는 최소 인접 항목 및 DBSCAN 솔루션 매개 변수를 만듭니다.
      클러스터링 솔루션에 추가해야 하는 나머지 두 개의 솔루션 매개 변수입니다. 이 두 가지 최종 매개변수는 Connect 구성요소 기능을 활성화합니다.

      최소 인접 솔루션 매개변수를 선택, 구성 및 제출할 때 사용자 입력 필드를 값 1로 설정해야 합니다. 일부 매개변수에만 사용자 입력 필드가 있습니다.

      최소 인접 항목 매개변수에 대한 사용자 입력 필드에 값을 추가하는 방법입니다. 이 시나리오에서는 값을 1로 입력합니다.

      결과:

      Connect 구성 요소가 클러스터링 솔루션에 대해 구성되어 있습니다. 두 솔루션 매개변수는 이 절차의 1-6단계에서 구성한 Levenshtein 거리 매개변수와 함께 클러스터링 정의 양식의 고급 솔루션 설정 탭에 나타납니다.

      클러스터링 솔루션의 Advanced Solution Settings(고급 솔루션 설정) 섹션에서 구성한 세 가지 솔루션 매개 변수입니다.