모델 테스트 및 게시
모델의 성능을 NLU 평가하여 개선 영역을 식별합니다. 그런 다음 모델을 게시하여 다음과 같은 가상 에이전트다른 애플리케이션에서 사용할 수 있도록 합니다.
요약 사용량
가상 에이전트 모델이 어떻게 반응하는지 보려면 기본 테스트 세트에 대해 또는 AI 검색 모델을 테스트하십시오. 테스트 결과는 모델을 개선하는 데 사용할 수 있는 정보를 제공합니다.
모델을 테스트하려면 . 모델의 애플리케이션에 대한 탭을 선택한 다음 모델의 이름을 선택합니다. 모델 테스트 및 게시 카드에서 단계 보기를 선택합니다.
개요
모델 테스트 및 게시 단계는 기본적으로 개요 페이지에서 열립니다. 새 테스트 실행 및 모델 게시 버튼이 여기에 있습니다.
개요는 테스트 결과를 요약하는 막대형 차트와 함께 이전 테스트 실행에 대한 정보를 제공합니다.
이전 테스트 실행이 있는 경우 테스트 실행 날짜 목록에서 선택하여 볼 수 있습니다.
테스트 결과 테이블로 드릴다운하려면 자세한 결과 탭을 선택합니다. 각 테스트 발화는 예측과 함께 자세한 결과에 나열됩니다.
테스트 결과 이해
테스트 결과는 모델이 테스트 세트의 발언에 응답한 방법을 보여줍니다.
| 백분율 | 설명 |
|---|---|
| 정답 | 모델이 의도를 올바르게 예측한 발언의 백분율입니다. 모델이 관련 없음으로 표시된 발언에 대해 의도를 예측하지 않으면 해당 결과는 올바른 것으로 계산됩니다. |
| 여러 항목 중 올바름 | 둘 이상의 의도가 예측된 발언의 경우. 모델이 의도를 올바르게 예측했지만 발화에 속하지 않는 의도도 예측한 발화의 백분율입니다. |
| 누락됨 | 예상된 의도가 있었지만 모델이 의도를 예측하지 못한 발언의 백분율입니다. |
| 오답 | 모델이 정확하지 않은 의도를 예측한 발언의 백분율입니다. |
테스트는 모델의 신뢰도 임계치에 영향을 줄 수 있습니다. 신뢰도 임계치는 모델이 발언의 의도를 예측할 수 있는 신뢰도를 결정합니다. 신뢰도 임계값에 대한 자세한 내용은 을 참조하십시오 NLU 모델 설정.
의도를 예측하지 않아야 하는 발언에 대한 자세한 내용은 을 참조하십시오 NLU에서 관련 없음 탐지.
모델 게시
모델 게시에 대한 자세한 내용은 을 참조하십시오 모델 게시 NLU.
다중 모델 배치 테스트
모델 테스트 및 게시 단계에서는 기본 테스트 세트에 대해 모델을 테스트합니다. 다중 모델 배치 테스트를 사용하면 다른 테스트 세트에 대해 테스트하고, 한 번에 여러 모델을 테스트하고, 테스트 결과를 볼 수 있습니다. 다중 모델 배치 테스트를 사용하려면 다음으로 이동합니다. .
자세한 내용은 다중 모델 배치 테스트 문서를 참조하십시오.
테스트 프로세스에 대한 자세한 내용은 을 참조하십시오 내 모델 테스트.