내 모델 테스트
(NLU) 모델을 기본 테스트 세트와 비교하여 테스트 자연어 이해 합니다. 테스트는 현재 콘텐츠에서 모델의 성능을 확인하는 데 도움이 됩니다.
시작하기 전에
- NLU 모델 빌더 - Core 플러그인, NLU 모델 빌더 플러그인 - NLU 워크벤치 고급 기능 플러그인 및 예측 인텔리전스 플러그인이 모두 설치되고 활성화되어 있는지 확인합니다.
- AI 검색에 대해 학습된 모델이 있습니다.가상 에이전트 자세한 내용은 모델 빌드 및 교육 문서를 참조하십시오.
- 모델 테스트를 위한 테스트 세트가 있습니다. 자세한 내용은 테스트 세트 생성 및 관리 문서를 참조하십시오.
- 필요한 역할: nlu_editor, nlu_admin 또는 admin. 편집기를 모델에 할당해야 합니다.
이 태스크 정보
테스트 발언과 예상 의도가 포함된 기본 테스트 세트를 사용하여 모델 테스트를 실행합니다.
- 테스트 세트의 예상 의도가 모델의 의도와 일치하지 않는 경우 해당 의도를 가진 발화는 테스트에 사용되지 않습니다. 테스트 결과에 포함되지 않습니다.
- 대화 상자 법의 대화 중 응답은 에서 시도하거나 테스트 NLU 워크벤치할 수 없습니다.
- 모델이 관련 없음으로 표시된 발화에 대한 예측을 반환하지 않으면 해당 결과는 올바른 것으로 계산됩니다.
- 테스트 세트가 모델에 있는 의도의 60% 이상을 다루지 않는 경우 시스템은 신뢰도 임계치를 권장하지 않습니다. 그러나 테스트를 계속 실행할 수 있습니다.
이 예제 시나리오에서는 모델을 교육했으며 성능을 평가하려고 합니다.
프로시저
결과
테스트가 완료되면 모델 테스트 및 게시 페이지가 다시 로드됩니다. 테스트 실행 날짜 필드에는 이 테스트의 날짜 및 시간이 반영됩니다.
개요 탭에는 테스트 결과의 차트가 표시됩니다. 또한 상위 5개의 잘못된 의도와 상위 5개의 누락된 의도 목록도 표시됩니다.
상세 결과 탭에는 모든 테스트 발언과 예측 결과가 나열됩니다.
테스트 및 모델 게시에서 테스트 이력 보기를 클릭하거나 다음으로 이동하여 이전 테스트 결과를 볼 수 있습니다. .
다음에 수행할 작업
결과를 사용하여 모델의 컨텐츠를 편집하고 개선합니다. 결과가 만족스러우면 모델을 게시하여 (예 가상 에이전트: )를 사용하는 애플리케이션에서 사용할 수 있도록 합니다.