NLU 어휘
어휘 항목을 사용하여 NLU 시스템에서 사용자가 요청을 표현하는 다양한 방법을 인식할 수 있습니다. 어휘 소스를 사용하면 시스템이 테이블이나 목록의 객체(예: 회의실 이름 또는 카탈로그 항목)를 인식할 수 있습니다.
어휘 사용 및 컨텍스트
어휘는 모델에서 사용자로부터 접할 수 있는 다양한 단어와 구를 활용하는 데 도움이 됩니다. 인간은 컴퓨터가 아니기 때문에 같은 것을 말하기 위해 다른 방법을 생각해 낼 수 있습니다. 예를 들어 한 사용자가 전체 구문이 아닌 약어를 입력하는 경우 시스템은 발언의 컨텍스트를 사용하여 올바른 의도를 예측할 수 있습니다. 그러나 어휘 항목으로 약어를 정의하면 모델의 신뢰도 수준과 역량을 높여 의도를 정확하게 예측할 수 있습니다.
어휘 항목은 발언에 나타날 수 있는 다양한 단어나 구를 다룹니다. 어휘 항목은 의도 예측을 위해 사용자가 제공하는 동의어에 매핑됩니다. 이렇게 하면 시스템이 사용자가 요청을 표현하는 다양한 방법을 인식하는 동시에 예측의 일관성, 신뢰도 및 정확성을 보장할 수 있습니다.
어휘 항목 유형
| 유형 | 정의 |
|---|---|
| 정규 | 일반적으로 알려지지 않은 단어나 구입니다(예: 비즈니스 또는 산업 특정 용어 또는 약어). 일반 어휘는 대소문자를 구분하지 않으므로 모든 대소문자 변형은 사용자가 만든 어휘에 의해 캡처됩니다. 일반 어휘 항목 만들기 문서를 참조하십시오. |
| 패턴 | 이메일 주소 및 전화 번호와 같은 특정 형식을 캡처할 수 있는 정규 표현식(regex)입니다. 패턴 어휘 항목 생성 문서를 참조하십시오. |
어휘 출처
- 모델이 사용할 단일 동의어에 쉽게 매핑할 수 있는 개별 단어, 구 또는 패턴에 대한 어휘 항목을 사용합니다.
- 어휘 소스를 사용하여 테이블이나 목록을 참조 ServiceNow 하면 정의한 단일 동의어로 값을 모두 바꿀 수 있습니다. 어휘 소스는 모든 NLU 모델에서 재사용할 수 있습니다.
사용자 발언이 집합의 개체를 참조할 때 어휘 소스를 사용합니다. 소스는 테이블의 값 ServiceNow 목록 또는 카탈로그 항목 목록, 회의실 등의 사용자가 정의한 정적 목록에서 참조할 수 있습니다. 이러한 원본을 만들고 저장한 후에는 @ 기호를 사용하여 학습 발화에서 지정할 수 있습니다. 이러한 소스를 엔터티 값으로 사용할 수도 있습니다.
예를 들어 사무실의 모든 회의실 목록이 이미 있다고 가정해 보겠습니다. 의도의 교육 발언에 각 회의실 이름을 입력하는 대신 해당 목록을 참조하는 어휘 소스를 생성할 수 있습니다.
어휘 출처를 만들려면 및 목록 어휘 소스 만들기을 참조하십시오테이블 어휘 소스 만들기.
의도와 관련된 어휘 사용
| 발언 | 문제 및 해결책 |
|---|---|
| "sfcrm에 액세스해야 합니다." |
|
| "Word를 설치해야 합니다." |
|
최상의 결과를 위해 한 단어 또는 짧은 구를 동의어로 사용하십시오. 여러 어휘 항목을 하나의 동의어에 매핑할 수 있습니다. 하나의 어휘 항목을 여러 동의어에 매핑하지 마십시오.
더 많은 컨텍스트와 예제는 다음 문서를 참조하십시오 NLU 의도 작성.
패턴 어휘 항목에 대한 정규 표현식 예제
어휘 항목을 사용하여 약어 IT를 식별하고 동의어 정보 기술에 매핑하려고 한다고 가정해 보겠습니다.
일반 어휘 항목은 기본적으로 대소문자를 구분하지 않습니다. 즉, 일반 어휘 항목은 약어 IT 및 일반 단어 it와 모두 일치합니다. 따라서 패턴 어휘 항목을 사용하기로 결정합니다.
사용할 수 있는 정규 표현식 패턴은 \bIT\b입니다. \b는 단어 경계 표식입니다. 이렇게 하면 패턴이 예를 들어 ITSM 또는 JIT에 일치하지 않습니다. 패턴 어휘 항목의 기본 대/소문자 구분은 \bIT\b 가 일반적인 단어 it와 일치하지 않음을 의미합니다.
정규 표현식 상세 정보: (?i)를 사용하여 패턴에서 대/소문자 구분을 해제할 수 있습니다. (?-i)에서와 같이 빼기 기호를 사용하여 해당 모드를 종료할 수 있습니다. 예를 들어 (?i)te(?-i)st 는 test 및 TEst와 모두 일치해야 하지만 teST 또는 TEST와는 일치하지 않습니다.
자세한 내용은 엔터티에서 정규 표현식 사용 문서를 참조하십시오.