평가 활성화

  • 릴리스 버전: Zurich
  • 업데이트 날짜 2025년 09월 02일
  • 소요 시간: 3분
  • 지속적인 모니터링을 활성화하여 무작위 대화를 평가합니다.

    평가를 활성화하고 매일 수행할 평가 수를 설정합니다.
    1. 다음으로 이동 모두 > 프로세스 자동화 > 플로우 디자이너 을 클릭하고 플로우를 선택합니다.
    2. 평가 실행 플로우를 선택합니다.
    3. 플로우 편집을 선택합니다.
    4. 활성화를 선택합니다.

      평가 실행 플로우를 활성화합니다.

    5. 다음으로 이동 모두 > 시스템 속성 > 모든 속성.
    6. sn_na_conv_eval.maxEvaluateCount 속성을 검색하여 선택합니다.
    7. 필드를 업데이트하여 매일 평가할 대화의 최대 수를 설정합니다.

      값 필드를 업데이트합니다.

    8. 저장을 선택합니다.
    주:
    • 요구 사항에 따라 평가 매개변수 중 일부를 구성하려면 다음 문서를 참조하십시오 평가 구성.
    • 평가할 이력 데이터를 임포트하려면 배치 평가 실행 플로우를 활성화하여 배치 평가를 실행해야 합니다. 배치 평가 워크플로우에 대한 자세한 내용은 을 참조하십시오 배치 평가를 위한 평가 플로우.

    평가 대시보드와 대화 인사이트

    평가 대시보드와 CI(대화 인사이트) 애플리케이션을 함께 사용하면 시스템 성능에서 최종 사용자 만족도에 이르기까지 가상 에이전트 효과성에 대한 전체적인 그림을 그릴 수 있습니다.

    대화 인사이트에 대한 자세한 내용은 다음 문서를 참조하십시오 대화 인사이트.

    평가 대시보드에서 캡처한 메트릭 대화 인사이트에서 캡처한 메트릭

    평가 대시보드는 가상 에이전트 설계, 대화 상자 플로우 및 모델 정확도를 개선하는 데 도움이 되는 세분화된 진단 설명을 제공합니다. 작업 성공과 신뢰성에 중요한 차원에 따라 성과를 평가합니다. 예를 들어 "시스템이 제대로 작동하고 예상한 작업을 수행하고 있습니까?"

    • 의도 인식: 가상 에이전트가 사용자의 기본 목표를 올바르게 해석하는지 여부입니다.
    • 슬롯 채우기: 작업을 완료하는 데 필요한 구조화된 입력을 추출하는 정확도입니다.
    • 간결성: 장황하거나 반복적인 응답을 피합니다.
    • 일관성: 가상 에이전트 응답의 논리적 플로우 및 구성입니다.
    • 진실성: 응답이 환각이 아닌 맥락이나 지식 출처에 근거하도록 합니다.
    • 컨텍스트 보존: 동일한 세션에서 이전 사용자 입력을 기억하는 가상 에이전트의 기능입니다.
    • 교착 상태 방지: 가상 에이전트가 질문이나 응답을 반복하는 데 문제가 생기는 루프를 탐지합니다.
    • 사용자 만족도(프록시): 중요한 장애(예: 의도 인식 또는 슬롯 채우기)와 부정적인 사용자 인식의 상관 관계를 지정합니다.

    대화 인사이트는 고객 만족도와 노력 측정에 중점을 둡니다. CSAT(유추된 고객 만족도) 및 지원 신호를 사용하여 최종 사용자가 가상 에이전트와의 상호작용을 어떻게 인식하는지 보여줍니다. 예: "최종 사용자가 가상 에이전트의 성능에 만족합니까?"

    • 추론된 CSAT: 대화에 대한 전반적인 만족도를 추정하는 종합 점수(1-5)입니다.
    • 작업량 점수: 전송, 에스컬레이션, 반복된 데이터 수집 또는 대기 시간을 기준으로 사용자가 수행해야 하는 작업량(낮음/중간/높음)을 측정합니다.
    • 해결: 사용자의 문제가 완전히 또는 부분적으로 해결되었는지 또는 해결되지 않았는지 추적합니다.
    • 불만: 무례한 언어, 빈정거림 또는 어려움에 대한 불만과 같은 사용자 불만의 노골적인 징후를 감지합니다.
    • 혼동: 사용자와 가상 에이전트 또는 라이브 에이전트 간의 오해를 식별합니다.
    • 이전 및 에스컬레이션: 대화가 다른 에이전트, 팀 또는 감독자에게 전달될 때 플래그를 지정합니다.
    • 공감: 가상 에이전트 또는 라이브 에이전트가 얼마나 예의 바르고, 친근하고, 협조적이었는지를 평가합니다(낮음/중간/높음).
    • 다음 단계: 가상 에이전트 또는 라이브 에이전트가 결과, 지침 또는 후속 작업을 얼마나 명확하게 설명했는지 측정합니다(낮음/중간/높음).
    평가 대시보드와 대화 인사이트는 함께 가상 에이전트 구현을 위한 보완적인 가치를 제공합니다.
    • Conversation Insights는 모든 대화에서 고객 경험에 대한 간단하고 비용 없는 보기를 제공합니다.
    • 평가 대시보드는 세부적인 작업 중심 진단을 제공하여 가상 에이전트 설계 및 성능의 목표 개선을 가능하게 합니다.
    • AI 에이전트 분석 및 AI 컨트롤 타워 대시보드에 통합된 이러한 메트릭은 사용자에게 가상 에이전트 시스템 상태 및 최종 사용자 만족도에 대한 보완 뷰를 제공합니다.