Tester et valider
Testez l’exécution et les contrôles d’accès de votre agent, exécutez des évaluations automatisées et examinez les journaux Guardian avant d’approuver l’agent pour un déploiement de production.
Les tests valident à la fois que votre agent exécute correctement la tâche prévue et que votre configuration de sécurité fonctionne comme prévu. Les deux dimensions doivent être validées avant le déploiement en production.
Tester l’exécution de l’agent
Utilisez l’aire de jeux de tests pour Studio d'agents IA exécuter des exécutions de tests manuels sur votre agent à l’aide d’exemples d’énoncés. Vérifiez que l’agent termine la tâche prévue, utilise les outils appropriés et gère les cas limites et les scénarios d’échec de manière appropriée.
- Pour tester l’exécution d’un agent IA, reportez-vous à la section Manually test the execution of an AI agent.
- Pour tester l’exécution d’un workflow agentique, reportez-vous à la section Manually test the execution of an agentic workflow.
Tester les contrôles d’accès
Vérifiez que votre configuration ACL fonctionne correctement en exécutant des tests d’accès en tant qu’utilisateurs différents. Vérifiez que les utilisateurs qui devraient avoir accès peuvent appeler l’agent et que les utilisateurs qui ne devraient pas y avoir accès ne le peuvent pas.
- Pour tester l’accès de l’utilisateur à un agent IA, reportez-vous à la section Test user access to an AI agent.
- Pour tester l’accès de l’utilisateur à un workflow agentique, reportez-vous à la section Test user access to an agentic workflow.
Si les résultats des tests d’accès sont inattendus, passez en revue votre configuration d’ACL. Pour plus d’informations sur la façon dont les ACL interagissent entre les couches d’agent, de workflow et d’outil, reportez-vous Implement access control in Now Assist AI agents à la rubrique .
Exécuter des évaluations automatisées
Les évaluations automatisées testent votre agent par rapport à un ensemble de données d’entrées et de sorties attendues, fournissant des mesures de qualité cohérentes et reproductibles. Exécutez des évaluations une fois les tests manuels terminés afin d’établir une base de référence de performances avant la mise en service. Pour plus de détails sur ce processus, reportez-vous à la section Execute an agentic evaluation run.
Examiner les journaux du Guardian à partir du test
Exportez et examinez Gardien Now Assist les journaux de vos exécutions de tests avant leur mise en service. Les journaux vous indiquent le contenu détecté par Guardian pendant les tests, ce qui vous aide à décider si votre configuration de blocage actuelle est appropriée pour une utilisation en production. Consultez .
Si vous voyez des détections inattendues dans les journaux, ajustez la configuration de votre Guardian avant de continuer. Les causes courantes incluent des filtres de sujets sensibles trop larges ou des énoncés de test qui déclenchent la détection de caractère offensant.
Porte de validation de mise en service
Ne poursuivez pas tant Mise en service et surveillance que toutes les conditions suivantes ne sont pas vraies :
- Les tests d’exécution de l’agent réussissent pour vos scénarios d’utilisation définis.
- Les tests de contrôle d’accès confirment que seuls les utilisateurs prévus peuvent appeler l’agent.
- Les évaluations automatisées répondent au seuil de vos critères de réussite.
- Les journaux Guardian des tests ont été examinés et la configuration est confirmée comme appropriée pour la production.
Étape suivante
Lorsque tous les critères de seuil de validation sont remplis, passez à .Mise en service et surveillance