평가 활성화

취리히 AI 활성화

Release

zurich

ft:locale

ko-KR

ft:publication_title

취리히 AI 활성화

ft:clusterId

platai

bundleId

platai

workflow

Platform

평가 활성화

릴리스 버전: Zurich

업데이트 날짜 2025년 09월 02일

소요 시간: 3분

지속적인 모니터링을 활성화하여 무작위 대화를 평가합니다.

평가를 활성화하고 매일 수행할 평가 수를 설정합니다.

다음으로 이동 모두 > 프로세스 자동화 > 플로우 디자이너 을 클릭하고 플로우를 선택합니다.
평가 실행 플로우를 선택합니다.
플로우 편집을 선택합니다.
활성화를 선택합니다.
다음으로 이동 모두 > 시스템 속성 > 모든 속성.
sn_na_conv_eval.maxEvaluateCount 속성을 검색하여 선택합니다.
값 필드를 업데이트하여 매일 평가할 대화의 최대 수를 설정합니다.
저장을 선택합니다.

주:

요구 사항에 따라 평가 매개변수 중 일부를 구성하려면 다음 문서를 참조하십시오 평가 구성.
평가할 이력 데이터를 임포트하려면 배치 평가 실행 플로우를 활성화하여 배치 평가를 실행해야 합니다. 배치 평가 워크플로우에 대한 자세한 내용은 을 참조하십시오 배치 평가를 위한 평가 플로우.

평가 대시보드와 대화 인사이트

평가 대시보드와 CI(대화 인사이트) 애플리케이션을 함께 사용하면 시스템 성능에서 최종 사용자 만족도에 이르기까지 가상 에이전트 효과성에 대한 전체적인 그림을 그릴 수 있습니다.

대화 인사이트에 대한 자세한 내용은 다음 문서를 참조하십시오 대화 인사이트.


평가 대시보드에서 캡처한 메트릭	대화 인사이트에서 캡처한 메트릭
평가 대시보드는 가상 에이전트 설계, 대화 상자 플로우 및 모델 정확도를 개선하는 데 도움이 되는 세분화된 진단 설명을 제공합니다. 작업 성공과 신뢰성에 중요한 차원에 따라 성과를 평가합니다. 예를 들어 "시스템이 제대로 작동하고 예상한 작업을 수행하고 있습니까?" 의도 인식: 가상 에이전트가 사용자의 기본 목표를 올바르게 해석하는지 여부입니다. 슬롯 채우기: 작업을 완료하는 데 필요한 구조화된 입력을 추출하는 정확도입니다. 간결성: 장황하거나 반복적인 응답을 피합니다. 일관성: 가상 에이전트 응답의 논리적 플로우 및 구성입니다. 진실성: 응답이 환각이 아닌 맥락이나 지식 출처에 근거하도록 합니다. 컨텍스트 보존: 동일한 세션에서 이전 사용자 입력을 기억하는 가상 에이전트의 기능입니다. 교착 상태 방지: 가상 에이전트가 질문이나 응답을 반복하는 데 문제가 생기는 루프를 탐지합니다. 사용자 만족도(프록시): 중요한 장애(예: 의도 인식 또는 슬롯 채우기)와 부정적인 사용자 인식의 상관 관계를 지정합니다.	대화 인사이트는 고객 만족도와 노력 측정에 중점을 둡니다. CSAT(유추된 고객 만족도) 및 지원 신호를 사용하여 최종 사용자가 가상 에이전트와의 상호작용을 어떻게 인식하는지 보여줍니다. 예: "최종 사용자가 가상 에이전트의 성능에 만족합니까?" 추론된 CSAT: 대화에 대한 전반적인 만족도를 추정하는 종합 점수(1-5)입니다. 작업량 점수: 전송, 에스컬레이션, 반복된 데이터 수집 또는 대기 시간을 기준으로 사용자가 수행해야 하는 작업량(낮음/중간/높음)을 측정합니다. 해결: 사용자의 문제가 완전히 또는 부분적으로 해결되었는지 또는 해결되지 않았는지 추적합니다. 불만: 무례한 언어, 빈정거림 또는 어려움에 대한 불만과 같은 사용자 불만의 노골적인 징후를 감지합니다. 혼동: 사용자와 가상 에이전트 또는 라이브 에이전트 간의 오해를 식별합니다. 이전 및 에스컬레이션: 대화가 다른 에이전트, 팀 또는 감독자에게 전달될 때 플래그를 지정합니다. 공감: 가상 에이전트 또는 라이브 에이전트가 얼마나 예의 바르고, 친근하고, 협조적이었는지를 평가합니다(낮음/중간/높음). 다음 단계: 가상 에이전트 또는 라이브 에이전트가 결과, 지침 또는 후속 작업을 얼마나 명확하게 설명했는지 측정합니다(낮음/중간/높음).

평가 대시보드와 대화 인사이트는 함께 가상 에이전트 구현을 위한 보완적인 가치를 제공합니다.

Conversation Insights는 모든 대화에서 고객 경험에 대한 간단하고 비용 없는 보기를 제공합니다.
평가 대시보드는 세부적인 작업 중심 진단을 제공하여 가상 에이전트 설계 및 성능의 목표 개선을 가능하게 합니다.
AI 에이전트 분석 및 AI 컨트롤 타워 대시보드에 통합된 이러한 메트릭은 사용자에게 가상 에이전트 시스템 상태 및 최종 사용자 만족도에 대한 보완 뷰를 제공합니다.