단어 뭉치 만들기
텍스트 유사성을 기반으로 인스턴스 기록을 비교하는 데 시스템이 사용하는 어휘 역할을 하는 단어 및 구 모음을 빌드합니다. 말뭉치라는 단어는 머신 러닝 시스템이 이해할 수 있는 사전이라고 생각할 수 있습니다.
시작하기 전에
중요사항:
릴리스에서 오스트레일리아 분류, 클러스터링 및 유사성 프레임워크의 모델은 워크플로우 솔루션을 사용합니다. 이들은 미리 학습된 것이므로 새로운 솔루션에 단어 말뭉치가 필요하지 않습니다.
업그레이드 후에는 단어 말뭉치가 포함된 기존 솔루션이 다음에 재교육될 때 워크플로우 솔루션이 됩니다. 또한 단어 말뭉치 필드가 양식에서 제거됩니다.
레거시 컨텍스트에 대해 다음 정보가 제공됩니다.
이 태스크 정보
단어 말뭉치의 기본 목적은 모델 학습 NLU 을 위한 텍스트 데이터를 유추하는 것입니다. 솔루션에서 단어 말뭉치를 사용하는 경우 솔루션의 솔루션 정의 단계에서 학습을 위해 지정해야 합니다. 학습된 단어 말뭉치는 솔루션과 기능 전반에 걸쳐 재사용할 수 있습니다.
단어 말뭉치를 사용하면 테이블 또는 여러 테이블에서 유사한 기록 텍스트를 비교할 수 있습니다. 단어 말뭉치는 데이터 분석, 재사용 또는 검토를 위해 유사한 기록을 함께 그룹화하는 클러스터링과 같은 다른 시나리오에서도 유용할 수 있습니다. 말뭉치에 추가하는 항목은 다른 유사성 또는 클러스터링 솔루션에서 재사용하고 다양한 사용 사례에 적용할 수 있도록 회사 및 산업에 따라 달라야 합니다.
이 예시 절차에서는 인시던트 기록을 작업 중이며 해당 인시던트 케이스에 대한 해결 방법을 제공할 수 있는 관련 지식베이스(KB) 문서를 찾고자 합니다. 목표는 활성 인시던트를 게시된 KB 문서와 비교하는 새로운 유사성 솔루션에 적용할 수 있는 단어 말뭉치를 만드는 것입니다.