Attributs d’index Zing et de dictionnaire de recherche
Les attributs de dictionnaire suivants affectent la façon dont Zing indexe les tables ou classe les résultats de recherche.
Attributs d’index et de dictionnaire de recherche
- Comportement d’indexation
- Classement des résultats de recherche
- l’algorithme de classement par pertinence BM25
| Nom | Type de données | Concerne | S’applique à V3 ou V4 | Description | Étiquette | Besoin d’une réindexation ? | Table racine uniquement |
|---|---|---|---|---|---|---|---|
| attachment_index | booléen | Table | Les deux | Si vrai, les pièces jointes de la table sont indexées à des fins de recherche. | Index de la pièce jointe | VRAI | FAUX |
| no_text_index | booléen | Les deux | Les deux | Cet attribut sur un champ empêche le champ d’être inclus dans un index de texte. | Aucun index de texte | VRAI | FAUX |
| text_index _attachment_body _weight | Flotteur | Table | V4 | Spécifie la contrepartie (poids, valeur flottante) à accorder à un terme de recherche trouvé dans le corps d’une pièce jointe. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. | Poids du corps de la pièce jointe d’index de texte | FAUX | VRAI |
| text_index _attachment_displayed | booléen | Table | Les deux | Affiche les pièces jointes dans les résultats de recherche de texte. | Index de texte : pièce jointe affichée | FAUX | FAUX |
| text_index_attachment _title_weight | Flotteur | Table | V4 | Spécifie la contrepartie (poids, valeur flottante) à accorder à un terme de recherche trouvé dans le titre d’une pièce jointe. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. | Index de texte Poids du titre de la pièce jointe | FAUX | VRAI |
| text_index _auto_stop | booléen | Table | Les deux | Identifie automatiquement les mots vides et ne les indexe pas. En fonction du seuil spécifié dans text_index_auto_stop_threshold. | Arrêt automatique des index de texte | VRAI | VRAI |
| text_index_auto _stop_threshold | int | Table | Les deux | Seuil (nombre entier, nombre d’occurrences) pour qu’un mot devienne automatiquement un mot vide. Voir text_index_auto_stop. | Seuil d’arrêt automatique des index de texte | VRAI | VRAI |
| text_index_default _partial_matching_rule | Chaîne | Table | Les deux | Chaîne pour la configuration partielle de la règle de correspondance. L’entrée doit être basée sur Modifiez le mode de requête d’une table indexée. | Règle de correspondance partielle par défaut de l’index de texte | FAUX | VRAI |
| text_index _default_query_mode | Chaîne | Table | Les deux | Chaîne pour la configuration du mode requête. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée | Mode de requête par défaut de l’index de texte | FAUX | VRAI |
| text_index _disable_synonym | booléen | Table | Les deux | TRUE désactive la recherche sur les synonymes ainsi que sur le terme de recherche. | Index de texte : désactiver synonyme | FAUX | VRAI |
| text_index _enable_idf | booléen | Table | V3 | TRUE active le score TF-IDF. | Activation des index de texte pour IDF | FAUX | VRAI |
| text_index _filter_junk | booléen | Table | Les deux | Par défaut, la valeur TRUE et FALSE désactive le filtre de courrier indésirable pour une table. Par défaut, Zing n’indexe pas et ne recherche pas les nombres à 2 chiffres et les mots à un seul caractère (sauf s’il s’agit de caractères chinois ou japonais). Régénérez l’index après avoir désactivé le filtre de courrier indésirable. Cet attribut génère un index de table plus grand. Pour des performances optimales, ne l’appliquez pas à moins que cela ne soit nécessaire. | Filtre d’index de texte indésirable | VRAI | VRAI |
| text_index _filter_query | Une requête encodedQuery sur la table | Table | Les deux | Utilisez cet attribut lorsque vous souhaitez indexer les lignes correspondant à des conditions de filtre spécifiques. La valeur d’attribut doit être encodedQuery sur la table. | Filtre d’index | VRAI | FAUX |
| text_index_filterable | booléen | Colonne | Les deux | Si un champ avec cet attribut défini sur true est modifié, la ligne est évaluée pour la réindexation (même si le champ lui-même n’est pas indexable). | Index filtrable | VRAI | FAUX |
| text_index_include _stop_word | booléen | Table | Les deux | Si vous avez besoin d’indexer les mots vides dans cette table, définissez cet attribut sur true. | Index de texte Inclure un mot vide | VRAI | VRAI |
| text_index_scorer_bm25_b | Flotteur | Table | V4 | Cet attribut est le paramètre b utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_b. | bm25_b | FAUX | VRAI |
| text_index_scorer_bm25_k1 | Flotteur | Table | V4 | Cet attribut est le paramètre K1 utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_k1. | bm25_k1 | FAUX | VRAI |
| text_index_tags | Chaîne | Table | Les deux | Doit être défini sur une chaîne spécifique : empty/everyone_only/all_shared, selon le type de balises qui veulent être indexées. | Balises d’index de texte | VRAI | FAUX |
| text_index_tokenizer _language | Chaîne | Table | Les deux | Mettez « ja » (sans guillemet) lorsqu’il est nécessaire de prendre en charge la tokenisation en japonais. | Langue du créateur de jetons d’index de texte | VRAI | VRAI |
| text_index_translations | booléen | Table | Les deux | Si présent ou vrai, force le recalcul des index lorsque des chaînes traduites sont ajoutées. Requiert un rôle sys-admin pour modification. Automatiquement défini pour les champs indexés qui sont traduits et pour les champs qui ont une traduction et qui sont indexés. La propriété système glide.i18n.force_index, définie par défaut sur true, remplace cet attribut. | Traductions d’index de texte | VRAI | FAUX |
| text_search_and_or_limit | int | Table | Les deux | Ajoutez un text_search_and_or_limit d’attribut personnalisé au niveau de la table qui remplace la propriété globale. | Recherche de texte Limite Et Ou | FAUX | FAUX |
| ts_language | Chaîne | Colonne | Les deux | Ajouté pour permettre l’indexation de texte uniquement dans certaines langues. | Langue de recherche de texte | VRAI | FAUX |
| ts_multi_value_field _splitter | Chaîne | Colonne | Les deux | Si un champ est un champ à plusieurs valeurs, ajoutez le séparateur dans le champ de cet attribut pour répartir les positions d’index des valeurs. Par exemple, pour séparer multi :value, mettez : pour cet attribut. | Séparateur de champs à valeurs multiples de recherche de texte | VRAI | VRAI |
| ts_weight | int | Colonne | Les deux | Contrôle l’importance relative d’une correspondance dans le champ pour la recherche de texte. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. Pour apprendre à définir le poids d’une recherche textuelle pour un champ, reportez-vous à la section Définir le poids relatif d’un champ. | Poids de la recherche de texte | FAUX | FAUX |
no_text_index
Pour obtenir Service et assistance client des instructions sur la définition de l’option no_text_index pour différents types de champs, consultez KB0859922 sur le Now Support site.
text_index_scorer_bm25_b
Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut a une incidence sur l’importance de la longueur d’un document dans les résultats de recherche. Si cet attribut est 0, la longueur n’a pas de repère. Dans ce cas, un document de deux mots aurait la même valeur qu’un document de 1000 mots. Les documents très courts ont souvent une pondération inférieure à celle des documents plus longs. La valeur par défaut est 0,75.
text_index_scorer_bm25_k1
Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut aide à déterminer les caractéristiques de saturation de fréquence des termes, c’est-à-dire que l’affichage du terme de recherche dans un document augmente la pertinence du document, mais l’augmentation a moins d’impact à mesure que les chiffres augmentent. Par exemple, un terme de recherche apparaissant 10 fois dans un document le rend plus pertinent qu’un document qui n’a qu’une seule occurrence. Cependant, un document qui a 100 occurrences du terme de recherche peut ne pas avoir dix fois plus d’impact qu’un document qui a 10 occurrences. La pertinence se rapproche d’un effet maximal asymptote. Plus la valeur de l’attribut est élevée, plus l’effet maximal des occurrences multiples est faible. Les valeurs typiques se situent entre 1,25 et 2,0.