내 모델 테스트

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 읽기2분
  • 자연어 이해 기본 테스트 세트에 대해 (NLU) 모델을 테스트합니다. 테스트는 모델이 현재 콘텐츠에서 어떻게 수행되고 있는지 결정하는 데 도움이 됩니다.

    시작하기 전에

    • NLU 모델 빌더 - 코어 플러그인, NLU 모델 빌더 플러그인, NLU 워크벤치 - 고급 기능 플러그인 및 예측 인텔리전스 플러그인이 모두 설치되고 활성화되어 있는지 확인합니다.
    • 또는 AI 검색에 대해 가상 에이전트 교육된 모델이 있어야 합니다. 자세한 내용은 모델 빌드 및 교육 문서를 참조하십시오.
    • 모델을 테스트하기 위한 테스트 세트가 있습니다. 자세한 내용은 테스트 세트 생성 및 관리 문서를 참조하십시오.
    • 필요한 역할: nlu_editor, nlu_admin 또는 admin 모델에 편집기를 할당해야 합니다.

    이 태스크 정보

    테스트 발언과 예상 의도가 포함된 기본 테스트 세트를 사용하여 모델 테스트를 실행합니다.
    • 테스트 세트의 예상 의도가 모델의 의도와 일치하지 않는 경우 해당 의도가 있는 발언은 테스트에 사용되지 않습니다. 테스트 결과에는 포함되지 않습니다.
    • Dialog Acts의 대화 중간 응답은 에서 시도하거나 테스트 NLU 워크벤치할 수 없습니다.
    • 모델이 관련 없음으로 표시된 발화에 대해 예측을 반환하지 않으면 해당 결과는 올바른 것으로 계산됩니다.
    • 테스트 세트가 모델에서 의도의 60% 이상을 다루지 않는 경우 시스템은 신뢰도 임계치를 권장하지 않습니다. 그러나 테스트를 계속 실행할 수 있습니다.

    이 예제 시나리오에서는 모델을 학습시켰고 성능을 평가하려고 합니다.

    프로시저

    1. 다음으로 이동 모두 > NLU 워크벤치 > 모델.
      탭은 가상 에이전트 기본적으로 열립니다.
    2. 모델의 응용 프로그램에 대한 탭을 선택한 다음 테스트할 모델의 이름을 선택합니다.
    3. 모델 개요의 모델 세부 정보 탭에서 모델 테스트 및 게시 단계에 대한 카드를 찾은 다음 단계 보기를 클릭합니다.
    4. 새 테스트 실행을 선택합니다.
      주:
      테스트 중에는 다른 단계를 사용할 수 없습니다.
      모델 테스트 단계에서 새 테스트를 실행하고 게시합니다.
    5. 새 테스트 실행 확인 대화 상자가 열리므로 확인을 선택합니다.
      새 테스트 실행을 확인하는 대화 상자입니다.
      테스트가 시작되고 테스트가 진행 중입니다... 페이지가 로드됩니다.

    결과

    테스트가 완료되면 모델 테스트 및 게시 페이지가 다시 로드됩니다. 테스트 실행 날짜 필드에는 이 테스트의 날짜 및 시간이 반영됩니다.

    개요 탭에는 테스트 결과 차트가 표시됩니다. 또한 상위 5개의 잘못된 의도와 상위 5개의 누락된 의도 목록도 표시합니다.

    자세한 결과 탭에는 모든 테스트 발언과 예측 결과가 나열됩니다.

    모델 테스트 및 게시에서 테스트 기록 보기를 클릭하거나 다음으로 이동하여 이전 테스트 결과를 볼 수 있습니다. 배치 테스트 > 테스트 결과.

    다음에 수행할 작업

    결과를 사용하여 모델의 컨텐츠를 편집하고 개선합니다. 결과가 만족스러우면 모델을 게시하여 다음과 같은 가상 에이전트소비 애플리케이션에서 사용할 수 있도록 합니다.