Zing インデックスと検索ディクショナリの属性

  • リリースバージョン: Zurich
  • 更新日 2025年07月31日
  • 所要時間:8分
  • 次の辞書属性は、Zing がテーブルにインデックスを付ける方法や検索結果をランク付けする方法に影響します。

    インデックスと検索辞書属性

    Zing は、テーブルまたはフィールドレベルで設定された辞書属性を使用して、次の設定を構成します。
    • インデックスの動作
    • 検索結果のランキング
    • BM25 関連性ランキングアルゴリズム
    表 : 1. Zing インデックスと検索ディクショナリの属性
    名前 データタイプ 適用先 V3 または V4 に適用 説明 ラベル インデックスの再作成が必要ですか? ルートテーブルのみ
    attachment_index ブーリアン テーブル 両方 true の場合、テーブルの添付ファイルは検索のためにインデックス付けされます。 添付ファイルインデックス TRUE FALSE
    no_text_index ブーリアン 両方 両方 フィールドのこの属性は、フィールドがテキストインデックスに含まれることを防止します。 テキストインデックスなし TRUE FALSE
    text_index _attachment_body _weight 浮動小数点数 テーブル V4 添付ファイルの本文で見つかる検索用語に対する考慮事項 (重み付け、浮動小数点の値) を指定します。重み値が検索結果の関連性にどのように影響するかについて詳しくは、「Zing による 3 つのコンポーネントを使用したドキュメントスコアの計算」を参照してください。 テキストインデックス添付ファイル本文の重み付け FALSE TRUE
    text_index _attachment_displayed ブーリアン テーブル 両方 テキスト検索結果に添付ファイルを表示します。 表示されるテキストインデックスの添付ファイル FALSE FALSE
    text_index_attachment _title_weight 浮動小数点数 テーブル V4 添付ファイルのタイトルで見つかる検索用語に対する考慮事項 (重み付け、浮動小数点の値) を指定します。重み値が検索結果の関連性にどのように影響するかについて詳しくは、「Zing による 3 つのコンポーネントを使用したドキュメントスコアの計算」を参照してください。 テキストインデックス添付ファイルタイトルの重み付け FALSE TRUE
    text_index _auto_stop ブーリアン テーブル 両方 ストップワードを自動的に識別し、インデックス付けしません。text_index_auto_stop_threshold で指定されたしきい値に基づきます。 テキストインデックスの自動停止 TRUE TRUE
    text_index_auto _stop_threshold int テーブル 両方 単語が自動的にストップワードになるしきい値 (整数、出現回数)。text_index_auto_stop を参照してください。 テキストインデックスの自動停止しきい値 TRUE TRUE
    text_index_default _partial_matching_rule 文字列 テーブル 両方 部分一致ルール構成の文字列。入力は、「インデックス付きテーブルのクエリモードの変更」に基づいている必要があります。 テキストインデックスのデフォルトの部分一致ルール FALSE TRUE
    text_index _default_query_mode 文字列 テーブル 両方 クエリモード構成の文字列。入力は、「インデックス付きテーブルのクエリモードの変更」に基づいている必要があります テキストインデックスのデフォルトクエリモード FALSE TRUE
    text_index _disable_synonym ブーリアン テーブル 両方 TRUE を指定すると、同義語および検索用語の検索は無効になります。 テキストインデックスの同義語の無効化 FALSE TRUE
    text_index _enable_idf ブーリアン テーブル V3 TRUE を指定すると、TF-IDF スコアリングは有効になります。 テキストインデックスの IDF の有効化 FALSE TRUE
    text_index _filter_junk ブーリアン テーブル 両方 デフォルトは TRUE で、FALSE はテーブルのジャンクフィルターを無効にします。デフォルトでは、Zing はインデックスを作成したり、 2 桁の数字や 1 文字の単語を検索したりしません (中国語または日本語の文字を除く)。ジャンクフィルターを無効にした後、インデックスを再生成します。この属性を使用すると、テーブルインデックスが大きくなります。パフォーマンスの最適化のため、これは必要でない限り適用しないでください。 テキストインデックスフィルタージャンク TRUE TRUE
    text_index _filter_query テーブルの encodedQuery テーブル 両方 特定のフィルター条件に一致する行にインデックスを付ける場合は、この属性を使用します。属性値は、テーブルの encodedQuery である必要があります。 インデックスフィルター TRUE FALSE
    text_index_filterable ブーリアン 両方 この属性が true に設定されているフィールドが変更されると、その行は再インデックス化のために評価されます (フィールド自体がインデックス化可能でない場合も)。 インデックスフィルター可能 TRUE FALSE
    text_index_include _stop_word ブーリアン テーブル 両方 このテーブルのストップワードにインデックスを付ける必要がある場合は、この属性を true に設定します。 テキストインデックスにストップワードを含める TRUE TRUE
    text_index_scorer_bm25_b 浮動小数点数 テーブル V4 この属性は、BM25 アルゴリズムで使用される b パラメーターです。text_index_scorer_bm25_b を参照してください。 bm25_b FALSE TRUE
    text_index_scorer_bm25_k1 浮動小数点数 テーブル V4 この属性は、BM25 アルゴリズムで使用される K1 パラメーターです。text_index_scorer_bm25_k1 を参照してください。 bm25_k1 FALSE TRUE
    text_index_tags 文字列 テーブル 両方 インデックス付けするタグのタイプに応じて、特定の文字列 (empty/everyone_only/all_shared) に設定する必要があります。 テキストインデックスタグ TRUE FALSE
    text_index_tokenizer _language 文字列 テーブル 両方 日本語でトークン化をサポートする必要がある場合は、「ja」を入力します。 テキストインデックストークナイザー言語 TRUE TRUE
    text_index_translations ブーリアン テーブル 両方 存在するか true の場合、翻訳された文字列が追加されたときにインデックスが強制的に再計算されます。変更するには、sys-admin ロールが必要です。翻訳されるインデックス付きフィールドと、翻訳のあるインデックス作成中のフィールドに自動的に設定されます。glide.i18n.force_index システムプロパティ (デフォルトは true) は、この属性を上書きします。 テキストインデックスの翻訳 TRUE FALSE
    text_search_and_or_limit int テーブル 両方 グローバルプロパティを上書きするテーブルレベルのカスタム属性 text_search_and_or_limit を追加します。 テキスト検索および/または制限 FALSE FALSE
    ts_language 文字列 両方 特定の言語のみのテキストインデックス作成を許可するために追加されます。 テキスト検索言語 TRUE FALSE
    ts_multi_value_field _splitter 文字列 両方 1 つのフィールドが複数値フィールドである場合は、この属性のフィールドにスプリッターを追加して、値のインデックス位置を分散させます。たとえば、multi:value を区切るには、この属性に : を付けます。 テキスト検索複数値フィールドスプリッター TRUE TRUE
    ts_weight int 両方 テキスト検索の対象となるフィールドでの一致の相対的な重要度を制御します。重み値が検索結果の関連性にどのように影響するかについて詳しくは、「Zing による 3 つのコンポーネントを使用したドキュメントスコアの計算」を参照してください。フィールドのテキスト検索の重み付けを設定する方法については、「フィールドの相対的な重みの設定」を参照してください。 テキスト検索の重み付け FALSE FALSE

    no_text_index

    さまざまなフィールドタイプの [no_text_index] オプションの設定に関する カスタマーサービス & サポート ガイドラインについては、Now Support サイトの KB0859922 を参照してください。

    text_index_scorer_bm25_b

    この辞書属性は BM25 アルゴリズムの一部です。この属性は、検索結果のドキュメントの長さの重要性に影響を与えます。この属性が 0 の場合、長さは関係なくなります。その場合には、2 ワードのドキュメントも 1000 ワードのドキュメントと同等に評価されます。非常に短いドキュメントは、たいていの場合、長いドキュメントよりも重み付けが低くなります。デフォルトは 0.75 です。

    text_index_scorer_bm25_k1

    この辞書属性は BM25 アルゴリズムの一部です。この属性は、用語頻度の飽和特性を決定するのに役立ちます。つまり、検索用語をドキュメントに表示すると、ドキュメントの関連性は高まりますが、数値が増加してもその増加による影響は少なくなります。たとえば、検索用語がドキュメント内で 10 回出現すると、出現回数が 1 回しかないドキュメントよりも関連性が高くなります。ただし、検索語が 100 回出現するドキュメントは、出現回数が 10 回のドキュメントに比べて、10 倍もの影響はない場合があります。関連性は、最大効果の漸近線に近づきます。属性値が大きいほど、複数回出現の最大効果は低くなります。一般的な値は 1.25 〜 2.0 です。