Configurer la protection contre les attaques par injection d’invite

Rversion finale: Australia

Mis à jour 31 juil. 2025

1 minute de lecture

Activez ou désactivez la détection des attaques par injection d’invite pour protéger toutes les applications d’IA générative ainsi que le texte et les conversations générés par l’IA sur votre instance contre les entrées malveillantes et les comportements de modèle involontaires.

Avant de commencer

Rôle requis : sn_generative_ai.nsa_admin

Pourquoi et quand exécuter cette tâche

Les attaques par injection d’invite sont un type d’attaque de cybersécurité où une personne tente de passer outre les instructions initiales d’un LLM pour provoquer des comportements involontaires. Gardien Now Assist Détecte les tentatives d’injection d’invite avant qu’elles n’atteignent le modèle et les consigne ou bloque la réponse, selon votre configuration. Vous pouvez également configurer le garde-fou de détection d’injection d’invite pour bloquer la réponse générée par l’IA lorsqu’une attaque est détectée, en plus de l’enregistrer.

Vous pouvez exporter des journaux pour les examiner. Pour plus d’informations, consultez Exporter des journaux de Gardien Now Assist.

Procédure

Accédez à la Tous > Administrateur Now Assist > Paramètres.
Dans le panneau latéral, accédez à Gardien Now Assist > Injection d'invite.
Sélectionnez le bouton bascule Injection d’invite pour activer la détection d’injection d’invite.
Dans la section Choisir une action lorsque l’injection d’invite est détectée , sélectionnez l’une des options suivantes pour gérer les attaques détectées :
- Pour consigner la demande et la conversation tout en gardant la réponse du modèle visible pour l’utilisateur, sélectionnez Consigner la sortie.
- Pour bloquer la réponse du modèle et consigner la demande et la conversation, sélectionnez Bloquer la réponse et consigner la sortie.
Dans la section Sélectionner le niveau de gravité de l’attaque pour vérifier l’injection d’invite , sélectionnez un niveau de gravité pour vérifier l’injection d’invite.
- Pour signaler le moindre indice de tentatives d’injection ou de manipulation, sélectionnez Faible.
- Pour signaler les tentatives d’injection d’invite claires ou modérées, sélectionnez Moyen.
- Pour signaler uniquement les tentatives d’injection d’invite de certitude élevée, sélectionnez Élevé.
Sélectionnez Enregistrer.

Résultats

La détection d’injection d’invite est configurée sur votre instance pour tous les workflows de l’IA générative. Gardien Now Assist Détecte les tentatives d’injection d’invite en fonction du niveau de gravité que vous avez sélectionné et répond en fonction de l’action que vous avez configurée.