단어 말뭉치 만들기

  • 릴리스 버전: Zurich
  • 업데이트 날짜 2025년 07월 31일
  • 소요 시간: 3분
  • 텍스트 유사성을 기반으로 인스턴스 기록을 비교하기 위해 시스템이 사용하는 어휘 역할을 하는 단어 및 구문 모음을 빌드합니다. 말뭉치라는 단어는 기계 학습 시스템에서 이해하기를 원하는 사전으로 생각할 수 있습니다.

    시작하기 전에

    필요한 역할: admin 또는 ml_admin
    중요사항:
    Zurich 릴리스에서 분류, 클러스터링 및 유사성 프레임워크의 모델은 워크플로우 솔루션을 사용합니다. 이들은 미리 학습된 것이므로 새로운 솔루션에 단어 말뭉치가 필요하지 않습니다.

    업그레이드 후 단어 말뭉치가 있는 기존 솔루션은 다음에 다시 학습할 때 워크플로우 솔루션이 됩니다. 또한 단어 말뭉치 필드가 양식에서 제거됩니다.

    레거시 컨텍스트에 대해 다음 정보가 제공됩니다.

    이 태스크 정보

    단어 말뭉치의 주요 목적은 모델 학습을 위한 텍스트 데이터를 유추하는 것입니다 NLU . 솔루션에서 단어 말뭉치를 사용하는 경우 솔루션의 솔루션 정의 단계에서 학습용으로 해당 단어 말뭉치를 지정해야 합니다. 학습된 단어 말뭉치는 솔루션과 기능 전반에 걸쳐 다시 사용할 수 있습니다.

    단어 말뭉치를 사용하면 한 테이블이나 여러 테이블에서 유사한 기록 텍스트를 쉽게 비교할 수 있습니다. 단어 말뭉치는 데이터 분석, 재사용 또는 검토를 위해 유사한 레코드를 함께 그룹화하는 클러스터링과 같은 다른 시나리오에서도 유용할 수 있습니다. 말뭉치에 추가하는 항목은 다른 유사성 또는 클러스터링 솔루션에서 다시 사용하고 다양한 사용 사례에 적용할 수 있도록 회사 및 업계에 맞게 고유해야 합니다.

    이 예시 절차에서는 인시던트 기록에 대한 작업을 진행 중이며 해당 인시던트 케이스에 대한 해결 방법을 제공할 수 있는 관련 지식베이스(KB) 문서를 찾고자 합니다. 여기서의 목표는 활성 인시던트를 게시된 KB 문서와 비교하는 새로운 유사성 솔루션에 적용할 수 있는 단어 말뭉치를 만드는 것입니다.

    프로시저

    1. 다음으로 이동 모두 > 예측 인텔리전스 > 단어 뭉치.
    2. Word 말뭉치 양식에서 새로 만들기를 클릭합니다.
    3. 다음 지침에 따라 이러한 필드를 구성합니다.
      필드 설명
      이름 말뭉치의 내용을 참조하는 고유한 제목입니다. 예를 들어 이 사용 사례에서는 활성 인시던트 및 게시된 KB와 같은 이름을 입력할 수 있습니다. 이름은 솔루션을 만드는 데 도움이 되도록 말뭉치에서 마이닝할 테이블을 나타내기 때문입니다.
      활성 한 번에 둘 이상의 단어 말뭉치를 만들고 나중에 해당 세부 정보 구성요소를 구성하려는 경우 이 확인란을 선택합니다. 그렇지 않으면 이후 단계에서 선택할 수 있으므로 비워 둡니다.
    4. 제출을 선택합니다.
    5. Word 말뭉치 목록 보기에서 새 단어 뭉치를 찾아 해당 이름 값을 클릭하여 기록을 엽니다.
    6. Word 말뭉치 콘텐츠 섹션에서 새로 만들기를 클릭합니다.
    7. 단어 말뭉치 콘텐츠 양식에서 다음 지침에 따라 이러한 필드를 구성하여 단어 말뭉치에 대한 콘텐츠 구성요소를 정의합니다.
      필드 설명
      이름 지난 6개월 동안 종결된 인시던트와 같이 말뭉치에 추가하려는 데이터를 참조하는 제목을 입력합니다.
      테이블 단어 말뭉치에 포함할 데이터가 들어 있는 테이블을 선택합니다. 이 사용 사례에서는 인시던트 [incident]를 선택합니다.
      주:
      유사성 및 클러스터링 솔루션에 사용되는 단어 말뭉치 작성을 위한 테이블당 기록 수는 300,000개로 제한됩니다.
      필터 [ 종결됨], [비어 있지 않음] 및 [지난 6개월 동안 생성됨] 필터 조건 값을 선택합니다.
      필드 목록 이 사용 사례에서는 간단한 설명, 설명해결 메모를 선택합니다.
      도메인 시스템에서 말뭉치에 대한 사용자 그룹을 자동으로 표시합니다. 예를 들어 이 사용 사례에서는 전역 사용자 그룹을 보여줍니다. 다른 사용자 그룹도 선택할 수 있습니다.
    8. 제출을 선택합니다.
    9. Word 말뭉치 세부 정보 섹션에서 새로 만들기를 선택합니다.
    10. 다음 지침에 따라 이러한 필드를 구성하여 단어 말뭉치에 대한 두 번째 컨텐츠 구성요소를 정의합니다.
      필드 설명
      이름 첫 번째 컨텐츠 구성요소(예: 게시된 KB 문서)와 비교할 데이터를 참조하는 제목을 입력합니다.
      테이블 첫 번째 컨텐츠 구성요소와 비교할 데이터가 들어있는 테이블을 선택합니다. 이 사용 사례에서는 지식 [kb_knowledge]을 선택합니다.
      주:
      유사성 및 클러스터링 솔루션에 사용되는 단어 말뭉치 작성을 위한 테이블당 기록 수는 테이블당 300,000개 기록으로 제한됩니다.
      필터 다음 필터 조건 값을 선택합니다. [워크플로우] [다음과 같음] [게시됨].
      필드 목록 간단한 설명문서 본문을 선택합니다.
    11. 제출을 선택합니다.

      두 단어로 된 말뭉치 컨텐츠 구성요소가 단어 말뭉치 양식에 나타납니다.

      이 이미지는 단어 말뭉치에 대해 만든 두 가지 콘텐츠 구성요소를 보여줍니다.
    12. 업데이트를 선택합니다.

    결과

    생성한 완성된 단어 말뭉치는 단어 말뭉치 양식에 나타나며 유사성 및 클러스터링 솔루션 정의 양식에서 사용할 수 있습니다.

    업데이트를 클릭하면 시스템에서 구성요소 추가를 확인하여 말뭉치 생성 프로세스를 완료합니다.

    다음에 수행할 작업

    적절한 프레임워크에서 솔루션을 생성합니다. 자세한 내용은 이 페이지의 관련 컨텐츠 패널에 있는 링크를 참조하십시오.