Zing インデックスと検索ディクショナリの属性
次の辞書属性は、Zing がテーブルにインデックスを付ける方法や検索結果をランク付けする方法に影響します。
インデックスと検索辞書属性
Zing は、テーブルまたはフィールドレベルで設定された辞書属性を使用して、次の設定を構成します。
- インデックスの動作
- 検索結果のランキング
- BM25 関連性ランキングアルゴリズム
| 名前 | データタイプ | 適用先 | V3 または V4 に適用 | 説明 | ラベル | インデックスの再作成が必要ですか? | ルートテーブルのみ |
|---|---|---|---|---|---|---|---|
| attachment_index | ブーリアン | テーブル | 両方 | true の場合、テーブルの添付ファイルは検索のためにインデックス付けされます。 | 添付ファイルインデックス | TRUE | FALSE |
| no_text_index | ブーリアン | 両方 | 両方 | フィールドのこの属性は、フィールドがテキストインデックスに含まれることを防止します。 | テキストインデックスなし | TRUE | FALSE |
| text_index _attachment_body _weight | 浮動小数点数 | テーブル | V4 | 添付ファイルの本文で見つかる検索用語に対する考慮事項 (重み付け、浮動小数点の値) を指定します。重み値が検索結果の関連性にどのように影響するかについて詳しくは、「Zing による 3 つのコンポーネントを使用したドキュメントスコアの計算」を参照してください。 | テキストインデックス添付ファイル本文の重み付け | FALSE | TRUE |
| text_index _attachment_displayed | ブーリアン | テーブル | 両方 | テキスト検索結果に添付ファイルを表示します。 | 表示されるテキストインデックスの添付ファイル | FALSE | FALSE |
| text_index_attachment _title_weight | 浮動小数点数 | テーブル | V4 | 添付ファイルのタイトルで見つかる検索用語に対する考慮事項 (重み付け、浮動小数点の値) を指定します。重み値が検索結果の関連性にどのように影響するかについて詳しくは、「Zing による 3 つのコンポーネントを使用したドキュメントスコアの計算」を参照してください。 | テキストインデックス添付ファイルタイトルの重み付け | FALSE | TRUE |
| text_index _auto_stop | ブーリアン | テーブル | 両方 | ストップワードを自動的に識別し、インデックス付けしません。text_index_auto_stop_threshold で指定されたしきい値に基づきます。 | テキストインデックスの自動停止 | TRUE | TRUE |
| text_index_auto _stop_threshold | int | テーブル | 両方 | 単語が自動的にストップワードになるしきい値 (整数、出現回数)。text_index_auto_stop を参照してください。 | テキストインデックスの自動停止しきい値 | TRUE | TRUE |
| text_index_default _partial_matching_rule | 文字列 | テーブル | 両方 | 部分一致ルール構成の文字列。入力は、「インデックス付きテーブルのクエリモードの変更」に基づいている必要があります。 | テキストインデックスのデフォルトの部分一致ルール | FALSE | TRUE |
| text_index _default_query_mode | 文字列 | テーブル | 両方 | クエリモード構成の文字列。入力は、「インデックス付きテーブルのクエリモードの変更」に基づいている必要があります | テキストインデックスのデフォルトクエリモード | FALSE | TRUE |
| text_index _disable_synonym | ブーリアン | テーブル | 両方 | TRUE を指定すると、同義語および検索用語の検索は無効になります。 | テキストインデックスの同義語の無効化 | FALSE | TRUE |
| text_index _enable_idf | ブーリアン | テーブル | V3 | TRUE を指定すると、TF-IDF スコアリングは有効になります。 | テキストインデックスの IDF の有効化 | FALSE | TRUE |
| text_index _filter_junk | ブーリアン | テーブル | 両方 | デフォルトは TRUE で、FALSE はテーブルのジャンクフィルターを無効にします。デフォルトでは、Zing はインデックスを作成したり、 2 桁の数字や 1 文字の単語を検索したりしません (中国語または日本語の文字を除く)。ジャンクフィルターを無効にした後、インデックスを再生成します。この属性を使用すると、テーブルインデックスが大きくなります。パフォーマンスの最適化のため、これは必要でない限り適用しないでください。 | テキストインデックスフィルタージャンク | TRUE | TRUE |
| text_index _filter_query | テーブルの encodedQuery | テーブル | 両方 | 特定のフィルター条件に一致する行にインデックスを付ける場合は、この属性を使用します。属性値は、テーブルの encodedQuery である必要があります。 | インデックスフィルター | TRUE | FALSE |
| text_index_filterable | ブーリアン | 列 | 両方 | この属性が true に設定されているフィールドが変更されると、その行は再インデックス化のために評価されます (フィールド自体がインデックス化可能でない場合も)。 | インデックスフィルター可能 | TRUE | FALSE |
| text_index_include _stop_word | ブーリアン | テーブル | 両方 | このテーブルのストップワードにインデックスを付ける必要がある場合は、この属性を true に設定します。 | テキストインデックスにストップワードを含める | TRUE | TRUE |
| text_index_scorer_bm25_b | 浮動小数点数 | テーブル | V4 | この属性は、BM25 アルゴリズムで使用される b パラメーターです。text_index_scorer_bm25_b を参照してください。 | bm25_b | FALSE | TRUE |
| text_index_scorer_bm25_k1 | 浮動小数点数 | テーブル | V4 | この属性は、BM25 アルゴリズムで使用される K1 パラメーターです。text_index_scorer_bm25_k1 を参照してください。 | bm25_k1 | FALSE | TRUE |
| text_index_tags | 文字列 | テーブル | 両方 | インデックス付けするタグのタイプに応じて、特定の文字列 (empty/everyone_only/all_shared) に設定する必要があります。 | テキストインデックスタグ | TRUE | FALSE |
| text_index_tokenizer _language | 文字列 | テーブル | 両方 | 日本語でトークン化をサポートする必要がある場合は、「ja」を入力します。 | テキストインデックストークナイザー言語 | TRUE | TRUE |
| text_index_translations | ブーリアン | テーブル | 両方 | 存在するか true の場合、翻訳された文字列が追加されたときにインデックスが強制的に再計算されます。変更するには、sys-admin ロールが必要です。翻訳されるインデックス付きフィールドと、翻訳のあるインデックス作成中のフィールドに自動的に設定されます。glide.i18n.force_index システムプロパティ (デフォルトは true) は、この属性を上書きします。 | テキストインデックスの翻訳 | TRUE | FALSE |
| text_search_and_or_limit | int | テーブル | 両方 | グローバルプロパティを上書きするテーブルレベルのカスタム属性 text_search_and_or_limit を追加します。 | テキスト検索および/または制限 | FALSE | FALSE |
| ts_language | 文字列 | 列 | 両方 | 特定の言語のみのテキストインデックス作成を許可するために追加されます。 | テキスト検索言語 | TRUE | FALSE |
| ts_multi_value_field _splitter | 文字列 | 列 | 両方 | 1 つのフィールドが複数値フィールドである場合は、この属性のフィールドにスプリッターを追加して、値のインデックス位置を分散させます。たとえば、multi:value を区切るには、この属性に : を付けます。 | テキスト検索複数値フィールドスプリッター | TRUE | TRUE |
| ts_weight | int | 列 | 両方 | テキスト検索の対象となるフィールドでの一致の相対的な重要度を制御します。重み値が検索結果の関連性にどのように影響するかについて詳しくは、「Zing による 3 つのコンポーネントを使用したドキュメントスコアの計算」を参照してください。フィールドのテキスト検索の重み付けを設定する方法については、「フィールドの相対的な重みの設定」を参照してください。 | テキスト検索の重み付け | FALSE | FALSE |
no_text_index
さまざまなフィールドタイプの [no_text_index] オプションの設定に関する カスタマーサービス & サポート ガイドラインについては、Now Support サイトの KB0859922 を参照してください。
text_index_scorer_bm25_b
この辞書属性は BM25 アルゴリズムの一部です。この属性は、検索結果のドキュメントの長さの重要性に影響を与えます。この属性が 0 の場合、長さは関係なくなります。その場合には、2 ワードのドキュメントも 1000 ワードのドキュメントと同等に評価されます。非常に短いドキュメントは、たいていの場合、長いドキュメントよりも重み付けが低くなります。デフォルトは 0.75 です。
text_index_scorer_bm25_k1
この辞書属性は BM25 アルゴリズムの一部です。この属性は、用語頻度の飽和特性を決定するのに役立ちます。つまり、検索用語をドキュメントに表示すると、ドキュメントの関連性は高まりますが、数値が増加してもその増加による影響は少なくなります。たとえば、検索用語がドキュメント内で 10 回出現すると、出現回数が 1 回しかないドキュメントよりも関連性が高くなります。ただし、検索語が 100 回出現するドキュメントは、出現回数が 10 回のドキュメントに比べて、10 倍もの影響はない場合があります。関連性は、最大効果の漸近線に近づきます。属性値が大きいほど、複数回出現の最大効果は低くなります。一般的な値は 1.25 〜 2.0 です。