Directives générales pour les exécutions d’évaluation de workflow agentique
Découvrez les exécutions d’évaluation agentique et différentes recommandations pour évaluer vos workflows agentiques par rapport à des ensembles de données afin de vérifier l’achèvement, les performances et l’exécution de l’outil.
Vue d’ensemble des exécutions d’évaluation agentique
Les exécutions d’évaluation des workflows agentiques évaluent les exécutions de workflow agentiques pour différentes mesures, telles que l’achèvement des tâches, les performances et l’exécution de l’outil. Vous pouvez créer des jeux de données à l’aide de journaux pour les workflows agentiques.
Quand exécuter des évaluations agentiques
- Exécuter après avoir collecté suffisamment de données.
- Les exécutions d’évaluation sont mesurées par rapport aux journaux de l’activité du workflow agentique sur votre instance.
- Exécutez des évaluations agentiques lorsque vous apportez des changements importants.
- Après avoir mis à jour le workflow agentique, vous pouvez exécuter une exécution d’évaluation agentique pour suivre l’efficacité de la nouvelle version.
Choisir une méthode d’évaluation
- Passez en revue les options de méthode d’évaluation.
- L’évaluation Configuration guidée agentique fournit des informations sur chaque méthode d’évaluation, y compris ce qu’elles mesurent et comment elles fonctionnent. Vous pouvez également consulter les questions courantes dans la barre latérale pour obtenir des réponses sur les mesures disponibles.
- Utilisez plusieurs méthodes d’évaluation à la fois.
- Le choix de plusieurs méthodes d’évaluation peut fournir une meilleure image globale des performances du workflow agentique.
Création d’un jeu de données
- Utilisez des filtres pour cibler les bonnes données.
- Ajoutez des filtres aux journaux d’exécution pour contrôler exactement par rapport à quoi vous mesurez votre workflow agentique. Filtrez différents délais pour vérifier que vous mesurez la dernière version d’un workflow. Vous pouvez sélectionner Voir l’aperçu pour afficher une liste des enregistrements. Vous pouvez également utiliser les cases à cocher pour sélectionner des enregistrements individuels par rapport auxquels effectuer la mesure.