모델 테스트 및 게시

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 읽기2분
  • 모델의 성능을 NLU 평가하여 개선 영역을 식별합니다. 그런 다음 모델을 게시하여 다음과 같은 가상 에이전트다른 애플리케이션에서 사용할 수 있도록 합니다.

    요약 사용량

    가상 에이전트 모델이 어떻게 반응하는지 보려면 기본 테스트 세트에 대해 또는 AI 검색 모델을 테스트하십시오. 테스트 결과는 모델을 개선하는 데 사용할 수 있는 정보를 제공합니다.

    주:
    모델을 테스트하려면 의 NLU 워크벤치 - 고급 기능 애플리케이션 ServiceNow® Store에서 사용할 수 있는 다중 모델 배치 테스트 기능이 필요합니다. 자세한 내용은 NLU 워크벤치 설치 - 고급 기능 문서를 참조하십시오.

    모델을 테스트하려면 NLU 워크벤치 > 모델. 모델의 애플리케이션에 대한 탭을 선택한 다음 모델의 이름을 선택합니다. 모델 테스트 및 게시 카드에서 단계 보기를 선택합니다. 모델 단계 카드 테스트 및 게시

    개요

    모델 테스트 및 게시 단계는 기본적으로 개요 페이지에서 열립니다. 새 테스트 실행모델 게시 버튼이 여기에 있습니다.

    모델 개요 페이지 테스트 및 게시

    개요는 테스트 결과를 요약하는 막대형 차트와 함께 이전 테스트 실행에 대한 정보를 제공합니다.

    이전 테스트 실행이 있는 경우 테스트 실행 날짜 목록에서 선택하여 볼 수 있습니다.

    테스트 실행 날짜 풀다운

    테스트 결과 테이블로 드릴다운하려면 자세한 결과 탭을 선택합니다. 각 테스트 발화는 예측과 함께 자세한 결과에 나열됩니다.

    테스트 결과 이해

    테스트 결과는 모델이 테스트 세트의 발언에 응답한 방법을 보여줍니다.

    NLU 워크벤치의 모델 테스트에 대한 테스트 결과입니다.

    막대형 차트에는 여러 가지 중에서 정답, 올바름, 누락됨, 틀림에 대한 예측 백분율이 표시됩니다.
    백분율 설명
    정답 모델이 의도를 올바르게 예측한 발언의 백분율입니다.

    모델이 관련 없음으로 표시된 발언에 대해 의도를 예측하지 않으면 해당 결과는 올바른 것으로 계산됩니다.

    여러 항목 중 올바름

    둘 이상의 의도가 예측된 발언의 경우.

    모델이 의도를 올바르게 예측했지만 발화에 속하지 않는 의도도 예측한 발화의 백분율입니다.

    누락됨 예상된 의도가 있었지만 모델이 의도를 예측하지 못한 발언의 백분율입니다.
    오답 모델이 정확하지 않은 의도를 예측한 발언의 백분율입니다.

    테스트는 모델의 신뢰도 임계치에 영향을 줄 수 있습니다. 신뢰도 임계치는 모델이 발언의 의도를 예측할 수 있는 신뢰도를 결정합니다. 신뢰도 임계값에 대한 자세한 내용은 을 참조하십시오 NLU 모델 설정.

    의도를 예측하지 않아야 하는 발언에 대한 자세한 내용은 을 참조하십시오 NLU에서 관련 없음 탐지.

    모델 게시

    모델 게시 버튼을 사용하면 모델의 현재 버전을 다음과 같은 가상 에이전트다른 애플리케이션에서 사용할 수 있습니다.
    주:
    모델이 교육되지 않은 경우 모델 게시 버튼을 사용할 수 없습니다. 게시하기 전에 모델을 교육하려면 모델 빌드 및 교육 단계로 돌아갑니다.

    모델 게시에 대한 자세한 내용은 을 참조하십시오 모델 게시 NLU.

    다중 모델 배치 테스트

    모델 테스트 및 게시 단계에서는 기본 테스트 세트에 대해 모델을 테스트합니다. 다중 모델 배치 테스트를 사용하면 다른 테스트 세트에 대해 테스트하고, 한 번에 여러 모델을 테스트하고, 테스트 결과를 볼 수 있습니다. 다중 모델 배치 테스트를 사용하려면 다음으로 이동합니다. NLU 워크벤치 > NLU 고급 기능 > 다중 모델 배치 테스트.

    자세한 내용은 다중 모델 배치 테스트 문서를 참조하십시오.

    테스트 세트에 대한 자세한 내용은 다음을 참조하십시오.

    테스트 프로세스에 대한 자세한 내용은 을 참조하십시오 내 모델 테스트.