Index Zing et attributs du dictionnaire de recherche
Les attributs de dictionnaire suivants affectent la façon dont Zing indexe les tables ou classe les résultats de recherche.
Indexer et rechercher les attributs du dictionnaire
- Comportement d’indexation
- Classement des résultats de recherche
- l’algorithme de classement par pertinence BM25
| Nom | Type de données | Concerne | S’applique à V3 ou V4 | Description | Étiquette | Besoin d’une réindexation ? | Table racine uniquement |
|---|---|---|---|---|---|---|---|
| attachment_index | booléen | Table | Les deux | Si vrai, les pièces jointes de la table sont indexées à des fins de recherche. | Index des pièces jointes | VRAI | FAUX |
| no_text_index | booléen | Les deux | Les deux | Cet attribut sur un champ empêche l’inclusion du champ dans un index de texte. | Aucun index de texte | VRAI | FAUX |
| text_index _attachment_body _weight | flottant | Table | V4 | Spécifie le degré de considération (poids, valeur flottante) à donner à un terme de recherche trouvé dans le corps d’une pièce jointe. Pour en savoir plus sur l’incidence de la valeur de poids sur la pertinence des résultats de recherche, reportez-vous à la section Zing calcule les scores des documents à l’aide de trois composants. | Poids du corps de la pièce jointe d’index de texte | FAUX | VRAI |
| text_index _attachment_displayed | booléen | Table | Les deux | Affiche les pièces jointes dans les résultats de recherche de texte. | Pièce jointe d’index de texte affichée | FAUX | FAUX |
| text_index_attachment _title_weight | flottant | Table | V4 | Spécifie le degré de considération (poids, valeur flottante) à donner à un terme de recherche trouvé dans le titre d’une pièce jointe. Pour en savoir plus sur l’incidence de la valeur de poids sur la pertinence des résultats de recherche, reportez-vous à la section Zing calcule les scores des documents à l’aide de trois composants. | Poids du titre de la pièce jointe d’index de texte | FAUX | VRAI |
| text_index _auto_stop | booléen | Table | Les deux | Identifie automatiquement les mots vides et ne les indexe pas. En fonction du seuil spécifié dans text_index_auto_stop_threshold. | Arrêt automatique de l’index de texte | VRAI | VRAI |
| text_index_auto _stop_threshold | int | Table | Les deux | Seuil (nombre entier, nombre d’occurrences) pour qu’un mot devienne automatiquement un mot vide. Voir text_index_auto_stop. | Seuil d’arrêt automatique des index de texte | VRAI | VRAI |
| text_index_default _partial_matching_rule | Chaîne | Table | Les deux | Chaîne pour la configuration de la règle de correspondance partielle. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée. | Règle de correspondance partielle par défaut de l’index de texte | FAUX | VRAI |
| text_index _default_query_mode | Chaîne | Table | Les deux | Chaîne pour la configuration en mode requête. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée | Mode de requête par défaut d’index de texte | FAUX | VRAI |
| text_index _disable_synonym | booléen | Table | Les deux | VRAI désactive la recherche sur les synonymes ainsi que sur le terme recherché. | Index de texte Désactiver le synonyme | FAUX | VRAI |
| text_index _enable_idf | booléen | Table | V3 | TRUE active le score TF-IDF. | Index de texte Activer IDF | FAUX | VRAI |
| text_index _filter_junk | booléen | Table | Les deux | TRUE par défaut, FALSE désactive le filtre de courrier indésirable pour une table. Par défaut, Zing n’indexe pas et ne recherche pas les nombres à 2 chiffres et les mots à un seul caractère (sauf s’il s’agit de caractères chinois ou japonais). Régénérez l’index après avoir désactivé le filtre indésirable. Cet attribut entraîne un index de table plus grand. Pour des performances optimales, ne l’appliquez que si cela est nécessaire. | Courrier indésirable du filtre d’index de texte | VRAI | VRAI |
| text_index _filter_query | Une encodedQuery sur la table | Table | Les deux | Utilisez cet attribut lorsque vous souhaitez indexer les lignes correspondant à des conditions de filtre spécifiques. La valeur de l’attribut doit être une encodedQuery dans la table. | Filtre d’index | VRAI | FAUX |
| text_index_filterable | booléen | Colonne | Les deux | Si un champ avec cet attribut défini sur vrai est modifié, la ligne est évaluée pour réindexation (même si le champ lui-même n’est pas indexable). | Filtrable d’index | VRAI | FAUX |
| text_index_include _stop_word | booléen | Table | Les deux | Si vous devez indexer les mots vides dans cette table, définissez cet attribut sur vrai. | Inclure un mot vide d’index de texte | VRAI | VRAI |
| text_index_scorer_bm25_b | flottant | Table | V4 | Cet attribut est le paramètre b utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_b. | bm25_b | FAUX | VRAI |
| text_index_scorer_bm25_k1 | flottant | Table | V4 | Cet attribut est le paramètre K1 utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_k1. | bm25_k1 | FAUX | VRAI |
| text_index_tags | Chaîne | Table | Les deux | Doit être défini sur chaîne spécifique : empty/everyone_only/all_shared, selon le type de balises à indexer. | Balises d’index de texte | VRAI | FAUX |
| text_index_tokenizer _language | Chaîne | Table | Les deux | Mettez « ja » (sans guillemets doubles) lorsqu’il est nécessaire de prendre en charge la tokenisation en japonais. | Langue du créateur de jetons d’index de texte | VRAI | VRAI |
| text_index_translations | booléen | Table | Les deux | Si la valeur est présente ou vraie, force le recalcul des index lors de l’ajout de chaînes traduites. Nécessite un rôle sys-admin pour modifier. Défini automatiquement pour les champs indexés qui sont traduits et pour les champs qui ont une traduction et sont en cours d’indexation. La propriété système glide.i18n.force_index, définie par défaut sur true, remplace cet attribut. | Traductions d’index de texte | VRAI | FAUX |
| text_search_and_or_limit | int | Table | Les deux | Ajoutez un attribut personnalisé au niveau de la table text_search_and_or_limit qui remplace la propriété globale. | Recherche de texte et ou limite | FAUX | FAUX |
| ts_language | Chaîne | Colonne | Les deux | Ajouté pour permettre l’indexation de texte uniquement dans certaines langues. | Langue de recherche de texte | VRAI | FAUX |
| ts_multi_value_field _splitter | Chaîne | Colonne | Les deux | Si un champ est un champ à valeurs multiples, ajoutez le séparateur dans le champ de cet attribut pour répartir les positions d’index des valeurs. Par exemple, pour séparer multi :value, mettez : pour cet attribut. | Séparateur de champ à valeurs multiples de la recherche de texte | VRAI | VRAI |
| ts_weight | int | Colonne | Les deux | Contrôle l’importance relative d’une correspondance dans le champ pour la recherche de texte. Pour en savoir plus sur l’incidence de la valeur de poids sur la pertinence des résultats de recherche, reportez-vous à la section Zing calcule les scores des documents à l’aide de trois composants. Pour savoir comment définir la pondération de la recherche de texte pour un champ, reportez-vous à la section Définir le poids relatif d’un champ. | Poids de la recherche de texte | FAUX | FAUX |
no_text_index
Pour Service et assistance client obtenir des instructions sur la définition de l’option no_text_index pour différents types de champs, consultez KB0859922 sur le Now Support site.
text_index_scorer_bm25_b
Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut a une incidence sur l’importance de la longueur d’un document dans les résultats de recherche. Si cet attribut est 0, la longueur n’a pas de relèvement. Dans ce cas, un document de deux mots aurait la même valeur qu’un document de 1000 mots. Les documents très courts sont souvent moins pondérés que les documents plus longs. La valeur par défaut est 0,75.
text_index_scorer_bm25_k1
Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut permet de déterminer les caractéristiques de saturation de la fréquence des termes. En d’autres termes, l’apparition du terme de recherche dans un document augmente la pertinence du document, mais l’augmentation a moins d’impact à mesure que les chiffres augmentent. Par exemple, un terme de recherche apparaissant 10 fois dans un document le rend plus pertinent qu’un document qui n’a qu’une seule occurrence. Cependant, un document qui a 100 occurrences du terme de recherche peut ne pas avoir dix fois plus d’impact qu’un document qui a 10 occurrences. La pertinence se rapproche d’une asymptote à effet maximal. Plus la valeur de l’attribut est élevée, plus l’effet maximal des occurrences multiples est faible. Les valeurs typiques sont comprises entre 1,25 et 2,0.