단어 말뭉치 만들기
텍스트 유사성을 기반으로 인스턴스 기록을 비교하기 위해 시스템이 사용하는 어휘로서 기능을 하는 단어와 구의 컬렉션을 빌드합니다. 말뭉치라는 단어는 기계 학습 시스템에서 이해하려는 사전으로 생각할 수 있습니다.
시작하기 전에
이 태스크 정보
중요사항:
단어 말뭉치의 주요 목적은 모델 학습을 위한 텍스트 데이터를 유추하는 것입니다 NLU . 솔루션에서 단어 뭉치를 사용하는 경우 솔루션의 솔루션 정의 단계에서 학습할 수 있도록 해당 단어 뭉치를 지정해야 합니다. 학습된 단어 말뭉치는 여러 솔루션과 기능 간에 다시 사용할 수 있습니다.릴리스에서는 Xanadu 클러스터링 및 유사성 모델이 워크플로우 솔루션을 사용합니다. 이들은 미리 학습되어 있으므로 새 솔루션에 단어 말뭉치가 필요하지 않습니다. 업그레이드 후 단어 말뭉치가 포함된 기존 솔루션을 다시 교육하면 워크플로우 솔루션이 되고 단어 뭉치 필드가 양식에서 제거됩니다.
레거시 컨텍스트에 대해 제공되는 정보는 다음과 같습니다.
단어 말뭉치를 사용하면 한 테이블 또는 여러 테이블에서 유사한 기록 텍스트를 비교할 수 있습니다. 단어 말뭉치는 데이터 분석, 재사용 또는 검토를 위해 유사한 레코드를 함께 그룹화하는 클러스터링과 같은 다른 시나리오에서도 유용할 수 있습니다. 말뭉치에 추가하는 항목은 회사 및 업계에 따라 달라야 하므로 다른 유사성 또는 클러스터링 솔루션에서 재사용하고 다양한 사용 사례에 적용할 수 있습니다.
이 예시 절차에서는 인시던트 기록에 대한 작업을 수행하며 해당 인시던트 케이스에 대한 해결책을 제공할 수 있는 관련 KB(지식베이스) 문서를 찾으려고 합니다. 여기서의 목표는 활성 인시던트를 게시된 KB 문서와 비교하는 새로운 유사성 솔루션에 적용할 수 있는 단어 말뭉치를 만드는 것입니다.