プロンプトインジェクション攻撃保護の設定

リリースバージョン: Australia

更新日 2025年07月31日

所要時間：2分

プロンプトインジェクション攻撃検出を有効または無効にして、インスタンス上のすべての生成 AI アプリケーションと AI で生成されたテキストと会話を、悪意のある入力や意図しないモデル動作から保護します。

始める前に

必要なロール:sn_generative_ai.nsa_admin

このタスクについて

プロンプトインジェクション攻撃は、誰かが LLM の最初の指示を無効にして意図しない動作を引き起こしようとするサイバーセキュリティ攻撃の一種です。 Now Assist ガーディアンは、モデルに到達する前にプロンプトインジェクションの試行を検出し、構成に応じてログに記録するか、応答をブロックします。プロンプトインジェクション検出ガードレールを設定して、攻撃が検出されたときに、ログ記録に加えて AI が生成した応答をブロックすることもできます。

レビュー用にログをエクスポートできます。詳細については、「 Now Assist Guardian ログのエクスポート」を参照してください。

手順

移動先すべて > Now Assist アドミン > 設定.
サイドパネルで、 Now Assist Guardian > プロンプトインジェクション.
プロンプトインジェクションの検出を有効にするには、[プロンプトインジェクション ] トグルを選択します。
[ プロンプトインジェクションが検出されたときにアクションを選択 (Choose an action when prompt injection is detected)] セクションで、検出された攻撃を処理する次のいずれかのオプションを選択します。
- モデル応答をユーザーに表示したまま要求と会話をログに記録するには、[ 出力をログに記録する] を選択します。
- モデル応答をブロックし、要求と会話をログに記録するには、[ 応答をブロックして出力をログに記録する] を選択します。
[ プロンプトインジェクションを確認する攻撃重大度レベルを選択 (Select the attack severity level to check for prompt injection )] セクションで、プロンプトインジェクションを確認する重大度レベルを選択します。
- インジェクションまたは操作の試行のわずかなヒントでもフラグを立てるには、[ 低] を選択します。
- プロンプトインジェクションの試行をクリアまたは中程度にフラグを付けるには、[ 中] を選択します。
- 確実性が高いプロンプトインジェクションの試行のみにフラグを付けるには、[ 高] を選択します。
[保存] を選択します。

タスクの結果

プロンプトインジェクション検出は、すべての生成 AI ワークフローのインスタンスで構成されています。 Now Assist ガーディアンは、選択した重大度レベルに基づいてプロンプトインジェクションの試行を検出し、構成したアクションに従って応答します。