セマンティックインデックス構成フォーム

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:4分
  • [セマンティックインデックス構成] フォームには、 AI 検索 インデックス付きソースのセマンティックインデックス設定に関する情報が含まれています。このフォームは、インデックス付きソースのセマンティックインデックス作成設定を定義または変更するときに使用します。

    インデックス付きソースのセマンティックインデックス作成設定の定義と変更の詳細については、「 インデックス付きソースのセマンティックインデックス生成設定の構成」を参照してください。
    注:
    このフォームは、インスタンスで AI 検索 セマンティックコントローラー プラグイン (com.glide.ais.semantic_search) がアクティブな場合にのみ使用できます。このプラグインをアクティブ化するには、インスタンスに少なくとも 1 つ必要です Now Assist application すぐに利用できます
    表 : 1. セマンティックインデックス構成フォーム
    フィールド 説明
    [Name (名前)] このセマンティックインデックス構成によって生成されたセマンティックインデックスの一意の名前。たとえば、ナレッジテーブルのインデックス付きソースのセマンティックインデックス構成を作成する場合は、「 Knowledge-Table-semantic-index」といった名前を付けます。
    注:
    セマンティックインデックスの名前に特殊文字、アンダースコア、または空白を含めることはできません。
    モデルの埋め込み セマンティックインデックス構成に使用する埋め込みモデルのリスト。
    • デフォルト値:ServiceNow Embedding (E5)
    • サポートされている値は次のとおりです。
      • ServiceNow Embedding (E5):セマンティックインデックスのコンテンツに E5 微調整された埋め込みモデルを使用します。埋め込みモデルのエンコーダーの制限は 512 項です。
    [Active (アクティブ)] インスタンスのセマンティックインデックス構成を有効にするオプション。 AI 検索 は、指定されたインデックスソースからコンテンツのインデックスを作成するときに、非アクティブなセマンティックインデックス構成を無視します。
    インデックス付きソース

    このセマンティックインデックス構成を適用する AI 検索 インデックス付きソースへの参照。このフィールドは自動的に設定されます。

    インデックス付きソースの詳細については、「インデックス付きソース」を参照してください。

    アプリケーション セマンティックインデックス設定レコードのアプリケーションスコープ。このフィールドは自動的に設定されます。
    埋め込み用の構成をチャンクしています
    チャンク戦略 埋め込みモデルのセマンティック インデックス付きテキストをチャンクするときに使用する戦略。
    • デフォルト値:Passage
    • サポートされている値は次のとおりです。
      • Passage:長いテキストフィールド値のチャンク戦略。チャンク単位のセマンティックフィールド値からテキストにインデックスを付けます。各チャンクには、 Chunk UnitChunk Size の選択によって決定される単語または文の最大数が含まれています。
      • Truncate:短いテキストフィールド値のチャンク戦略。すべてのセマンティックインデックスフィールド値を連結し、 Maximum Total Words 制限まで用語のセマンティックインデックスを実行します。
      • Full Text:短いテキストフィールド値のチャンク戦略。すべてのセマンティックインデックスフィールドを連結し、埋め込みモデルのエンコーダー制限まですべての用語に対してセマンティックインデックスを実行します。
    • タイプ:選択
    重複する文

    セマンティックインデックスフィールド値からテキストのインデックスを作成するときに、チャンク間で重複する文の数。重複値が大きいほど、パフォーマンスを犠牲にして、セマンティックベクトル検索の再現率が増加します。

    このフィールドは、[Chunking Strategy] から [Passage] が選択されている場合にのみ表示されます。

    • デフォルト値:5
    • サポートされている値:負でない任意の整数
    • タイプ: 整数
    チャンク単位

    セマンティックベクトル検索でセマンティックフィールド値にインデックスを付けるときにチャンクサイズの基準として使用するテキスト単位。

    このフィールドは、[Chunking Strategy] から [Passage] が選択されている場合にのみ表示されます。
    • デフォルト値:Words
    • サポートされている値は次のとおりです。
      • Words:セマンティックインデックスフィールドの値をチャンクするテキスト単位として単語を使用します。各チャンクには、最大 Chunk Size 語を含めることができます。
      • Sentences:セマンティックインデックスフィールドの値をチャンクするテキスト単位として文を使用します。各チャンクには最大 Chunk Size 文を含めることができます。
    • タイプ:選択
    チャンクのサイズ

    セマンティックベクトル検索のセマンティックフィールド値にインデックスを付けるときにチャンクに含める単語または文の最大数 ( Chunk Unit の選択によって異なります)。

    このフィールドは、[Chunking Strategy] から [Passage] が選択されている場合にのみ表示されます。
    • デフォルト値:Chunk Unit から Words が選択されている場合は 250、Sentences から選択されている場合は 15Chunk Unit
    • サポートされている値:負でない任意の整数
    • タイプ: 整数
    最大合計単語数

    すべてのセマンティックインデックスフィールドの連結された値からセマンティックベクトル検索でインデックスを付ける単語の最大数。

    このフィールドは、[Chunking Strategy] から [Truncate] が選択されている場合にのみ表示されます。
    • デフォルト値: 500
    • サポートされている値:負でない任意の整数
    • タイプ: 整数