LLM トピックのテスト
仮想エージェントデザイナーチャットウィンドウで、大規模言語モデル (LLM) を使用するトピックをプレビュー、テスト、デバッグします。
チャットテストウィンドウで会話を実行することで、仕事をしながらトピックの機能をテストできます。デフォルトのテストウィンドウは、Web (サービスポータル) チャットクライアントです。
大規模言語モデル (LLM) トピックは、自然言語理解 (NLU) (NLU) トピックに比べ、より高速かつ簡単にテストできます。たとえば、NLU トピックのように、発言を更新したりモデルを再トレーニングしたりした後に、トピックを再テストする必要がありません。
仮想エージェントとサードパーティのメッセージングアプリとの統合を使用している場合、会話の要素がサードパーティのメッセージングアプリケーションでは異なって表示されることがあります。仮想エージェントを展開する予定のサードパーティアプリケーションで会話をテストします。
チャットテストウィンドウでの LLM トピックのテスト
または、[トピック] ページでアクティブな (公開済みの) LLM トピックをテストすることもできます。LLM アシスタントフィルターを使用して、そのアシスタントに関連付けられたトピックのみにトピックを制限し、[アクティブなトピックのテスト] を選択します。LLM アシスタントフィルターを使用しない場合は、[アクティブトピックのテスト] ドロップダウンリストから [LLM アシスタントトピックのテスト] を選択します。[トピック] ページから [ アクティブトピックのテスト ] オプションまたはサブオプションを使用すると、トピックディスカバリーが有効になるため、オプションとして表示されません。[トピック] ページからテストすると、チャットテストウィンドウに [アシスタント] ドロップダウンリストが表示されます。[アシスタント] ドロップダウンリストを表示するには仮想エージェントアシスタントで少なくともデフォルトのNow Assistを事前に設定しておく必要があります。トピックが 1 人の LLM アシスタントにのみ関連付けられている場合、[アシスタント] ドロップダウンリストはデフォルトでそのアシスタント名になります。複数のアシスタントがいる場合は、[アシスタント] ドロップダウンリストを使用して、連携するアシスタントを選択します。複数の LLM アシスタントの作成の詳細については、「 [アシスタント] 画面での LLM 仮想エージェントの管理」を参照してください。
仮想エージェント Web クライアントのNow Assistでチャットテストウィンドウが開きます。[アシスタント] ドロップダウンリストと [ トピックディスカバリーを含める ] オプションは、テストを開始した場所と LLM アシスタントを確立しているかどうかに応じて表示される場合があります。
発言にカーソルを合わせたときに表示される「いいね!」アイコン (「 」アイコン) または「よくないね」アイコン (「いいね」アイコン) または [よくないね] アイコン (「
のオプションから選択することで、LLM によって行われた各発言にフィードバックを提供できます。入力コレクターを除くすべての LLM 対応ユーザー入力には、次のフィードバックオプションがあります。
チャットテストウィンドウには、テスト時にトピックに関する詳細を提供する隣接するタブも表示されます。LLM トピックをテストするときは、次のタブを使用できます。
- [テストフレーズを分析] - 入力に基づくトピックディスカバリーの結果。
- 指示の変更 :LLM に送信されるトピック内のすべての指示のリスト。このタブは、単一のトピックをテストする場合にのみ使用できます。
- [変数] - 入力変数やライブエージェント変数など、会話で使用されるすべての変数のリスト。
- [変数を編集] - このトピックで使用される変数を編集するためのオプション。
- [コンテキスト] - トピックが実行されるコンテキストを (コンテキスト変数を使用して) 指定するためのオプション。
- [ログ] - 実行された処理のリスト。
- すべての LLM トピックタイプに対して、[ テストフレーズを分析]、[ 指示を変更 (Modify instructions)]、[ 変数]、および [ログ ] タブが表示されます。
- [変数を編集] タブは、トピックブロックとカスタムコントロールに対して表示されます。
- [トピックディスカバリーを含める] を選択すると、トピック、セットアップトピック、または雑談トピックの [コンテキスト] タブが表示されます。
[トピック] ページからテストを実行する場合、テストウィンドウには [ テストフレーズを分析]、[ 変数]、[ コンテキスト ] (デフォルトで利用可能で、[ トピックディスカバリーを含める ] オプションはありません)、および [ログ ] タブのみが表示されます。
[テストフレーズを分析] タブ
LLM 対応のトピックをテストすると、入力に基づいてトピックディスカバリーの結果が表示されます。プライマリ LLM アシスタントに関連付けられたトピックをテストすると、プライマリアシスタントの昇格されたトピックのみが表示されます。テストフレーズを入力すると、さまざまな検索結果が表示されます。 Genius 結果 スキル (トピック) ディスカバリー、 ナレッジベース (KB) 記事、カタログアイテムなどが有効になっています。スキル検索結果の下に、トピックに応じて変数と値 (変数 @laptop_make や値 macbook など) も一覧表示される場合があります。これらの Genius 結果は、公開されたトピックをテストしていて、[ トピックディスカバリーを含める ] オプションを選択した場合にのみ表示されます。[ トピックディスカバリーを含める ] オプションが非アクティブになっている場合は、トピックを公開してトピックディスカバリーを操作します。「検索インデックス作成を実行しています」というメッセージが表示される場合がありますが、トピックディスカバリーが更新されない場合でも、検索インデックス作成の実行中にテストできます。Genius 結果の仕組みの詳細については、「 Now Assist in AI Search」を参照してください。
さらに、[トピック] ページからアクティブな LLM アシスタントトピックをテストすると、セマンティック検索のスキル結果が表示されます。セマンティック検索は、検索用語の意味とコンテキストを分析し、その情報を使用して意味が似ている結果を見つけます。自然言語を解釈して検索の意図をより正確に反映することで、検索の再現性を改善します。トピックディスカバリーテストのためにセマンティック検索が無効になっている場合、それらの結果は表示されません。セマンティック検索の詳細については、「Semantic vector search in AI Search」を参照してください。
[指示の変更 (Modify instructions)] タブ
LLM に送信される指示がトピックに含まれている場合は、[ノード] カテゴリに表示されます。ノードカテゴリには、キャンバス上の LLM 対応ユーザー入力ノード、そのフィールド名、およびコンテンツが一覧表示されます。
任意の指示の内容を変更して、会話に最適な指示を開発できます。ノードで [ユーザープロンプトを強制 (Enforce user prompt )] がアクティブになっている場合は、青色のチェックアイコン () と ユーザープロンプトが強制された メッセージが表示されます。[ノードの指示を変更する ためのユーザープロンプトを強制する (Enforce user prompt )] を非アクティブ化します。
[変数] タブ
- 入力変数
- スクリプト変数
- ライブエージェント の変数
- 呼び出し元トピックとトピックブロック間で渡される変数
次の例は、グループ化されたリストコントロールの [入力変数] セクションを示しています。この変数情報は、静的リストコントロールと同様に表示されますが、変数はグループ化された選択肢のグループごとに分けられています。
[変数の編集] タブ
トピックブロックとカスタムコントロールをテストするときに、ノードにある変数を編集できます。
[コンテキスト] タブ
[コンテキスト] タブは、トピック、セットアップトピック、または雑談トピックをテストして、チャットに別のコンテキストを指定するときに表示されます。リストからコンテキスト変数を選択します。この変数には、トピックのインテントを決定したり、チャットをライブエージェントにルーティングする方法をコントロールするために使用できる、コンテキスト情報が含まれています。たとえば、変数のリストから portal を選択し、ポータル名「IT Express」を入力できます。テストケースの作成中は [コンテキスト] タブを使用できません。
コンテキスト変数の定義の詳細については、「 チャット関連情報を保存するためのコンテキスト変数を設定」を参照してください。仮想エージェントに含まれるライブエージェント変数の詳細については、「ライブエージェントチャットのコンテキスト変数」を参照してください。
次のステップ
トピックのテストが終了したら、テストチャットウィンドウを閉じます。必要に応じて、テスト情報を使用してトピックを調整し、より正確に実行できるようにします。たとえば、[テストフレーズを分析] タブで、結果に低いスコアや、[不確実 (Unsure)] または [不明 (Unknown)] の信頼度評価が返される場合があります。LLM 対応ユーザー入力ノードのトピックの説明または指示を更新することで、スコアを向上させることができます。