Commentaires humains pour les évaluations
Développez la section Commentaire humain pour afficher les détails des évaluations et leurs scores de satisfaction.
Rôle requis : interaction_admin
La section Évaluations affiche toutes les messageries instantanées qui ont été auto-évaluées par le grand modèle de langage (LLM). Vous avez la possibilité d’évaluer manuellement les conversations pour comparer les évaluations de l’IA à votre propre interprétation de la façon dont s’est déroulée la conversation de l’agent.
| Champ | Description |
|---|---|
| Numéro | Numéro d’évaluation attribué à chaque conversation de messagerie instantanée. Sélectionnez le numéro d’évaluation pour afficher la messagerie instantanée respective et ses évaluations. |
| État | État de l’évaluation. |
| Score de satisfaction utilisateur d’évaluation automatique | Score de satisfaction calculé automatiquement par le LLM. |
| Score de satisfaction de l’utilisateur humain | Score de satisfaction calculé en fonction de l’évaluation de l’utilisateur de la messagerie instantanée. |
| Écart | Différence entre les scores de satisfaction humaine et auto-évaluée. |
Évaluer manuellement une messagerie instantanée
- Sélectionnez l’évaluation que vous souhaitez noter manuellement.
- Activez l’option Afficher les scores d’évaluation automatique pour afficher l’évaluation de l’IA pour chaque catégorie.
- Pour chaque catégorie, sélectionnez votre réponse selon laquelle vous pensez que l’agent a répondu.
- Activez le bouton Autres mesures pour une évaluation plus détaillée.
- Une fois terminé, sélectionnez Soumettre.
La valeur du score de satisfaction de l’utilisateur humain est calculée en fonction de votre réponse aux questions. Vous pouvez voir vos réponses pour chaque évaluation en la sélectionnant, puis en sélectionnant Afficher les scores humains. L’option Exporter vous permet d’exporter les données dans le format de votre choix.
Vous pouvez également étiqueter de manière aléatoire les évaluations en sélectionnant Étiqueter des scores aléatoires. Lorsque cette option est sélectionnée, une liste de 10 conversations aléatoires non évaluées des 10 derniers jours est chargée pour l’étiquetage manuel.