評価のための人間によるフィードバック

  • リリースバージョン: Zurich
  • 更新日 2025年08月13日
  • 所要時間:1分
  • [人間のフィードバック] セクションを展開して、評価とその満足度スコアの詳細を表示します。

    必要なロール:interaction_admin

    注:
    レコードにラベルを付けたり、会話にラベルを付けたりするには、トランスクリプトへのアクセス権が必要であり、interaction_adminロールを持つユーザーのみがトランスクリプトにアクセスできます。

    [人間によるフィードバック] セクション。

    [評価] セクションには、大規模言語モデル (LLM) によって自動評価されたすべてのチャットが表示されます。会話を手動で評価して、AI 評価をエージェントの会話の独自の解釈と比較するオプションがあります。

    フィールド 説明
    番号 各チャット会話に割り当てられた評価番号。評価番号を選択すると、それぞれのチャットとその評価が表示されます。
    状況 評価のステータス。
    自動評価ユーザー満足度スコア LLM によって自動的に計算された満足度スコア。
    人間のユーザー満足度スコア チャットのユーザー評価に基づいて計算された満足度スコア。
    ギャップ 人間と自動評価による満足度スコアの差。

    チャットを手動で評価する

    各チャットを手動で評価して、AI 評価と比較できます。
    1. 手動でスコアリングする評価を選択します。
    2. [ 自動評価スコアを表示 ] スイッチをオンに切り替えると、各カテゴリの AI 評価が表示されます。
    3. カテゴリごとに、エージェントがどの程度正確に応答したと感じるかについての回答を選択します。

      評価の詳細。

    4. より詳細な評価を行うには、[ その他のメトリクス ] スイッチをオンに切り替えます。
    5. 完了したら、[ 送信] を選択します。

    [人間のユーザー満足度スコア] の値は、質問に対するユーザーの回答に基づいて計算されます。各評価に対する応答を表示するには、評価を選択し、[ ヒューマンスコアの表示] を選択します。[ エクスポート ] オプションを使用すると、希望する形式でデータをエクスポートできます。

    [ ランダムスコアにラベルを付ける] を選択して、評価にランダムにラベルを付けることもできます。選択すると、過去 10 日間の評価されていないランダムな 10 件の会話のリストがロードされ、手動でラベル付けできます。