Attributs d’index Zing et de dictionnaire de recherche

Washington DC Now Platform Administration

Release

washingtondc

ft:locale

fr-FR

ft:publication_title

Washington DC Now Platform Administration

ft:clusterId

platadm

bundleId

platadm

workflow

Platform

Attributs d’index Zing et de dictionnaire de recherche

Rversion finale: Washingtondc

Mis à jour 7 févr. 2024

6 minutes de lecture

Les attributs de dictionnaire suivants affectent la façon dont Zing indexe les tables ou classe les résultats de recherche.

Attributs d’index et de dictionnaire de recherche

Zing utilise des attributs de dictionnaire définis au niveau de la table ou du champ pour configurer les paramètres suivants :

Comportement d’indexation
Classement des résultats de recherche
l’algorithme de classement par pertinence BM25

Tableau 1. Attributs d’index Zing et de dictionnaire de recherche
Nom	Type de données	Concerne	S’applique à V3 ou V4	Description	Étiquette	Besoin d’une réindexation ?	Table racine uniquement
attachment_index	booléen	Table	Les deux	Si vrai, les pièces jointes de la table sont indexées à des fins de recherche.	Index de la pièce jointe	VRAI	FAUX
no_text_index	booléen	Les deux	Les deux	Cet attribut sur un champ empêche le champ d’être inclus dans un index de texte.	Aucun index de texte	VRAI	FAUX
text_index _attachment_body _weight	Flotteur	Table	V4	Spécifie la contrepartie (poids, valeur flottante) à accorder à un terme de recherche trouvé dans le corps d’une pièce jointe. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :.	Poids du corps de la pièce jointe d’index de texte	FAUX	VRAI
text_index _attachment_displayed	booléen	Table	Les deux	Affiche les pièces jointes dans les résultats de recherche de texte.	Index de texte : pièce jointe affichée	FAUX	FAUX
text_index_attachment _title_weight	Flotteur	Table	V4	Spécifie la contrepartie (poids, valeur flottante) à accorder à un terme de recherche trouvé dans le titre d’une pièce jointe. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :.	Index de texte Poids du titre de la pièce jointe	FAUX	VRAI
text_index _auto_stop	booléen	Table	Les deux	Identifie automatiquement les mots vides et ne les indexe pas. En fonction du seuil spécifié dans text_index_auto_stop_threshold.	Arrêt automatique des index de texte	VRAI	VRAI
text_index_auto _stop_threshold	int	Table	Les deux	Seuil (nombre entier, nombre d’occurrences) pour qu’un mot devienne automatiquement un mot vide. Voir text_index_auto_stop.	Seuil d’arrêt automatique des index de texte	VRAI	VRAI
text_index_default _partial_matching_rule	Chaîne	Table	Les deux	Chaîne pour la configuration partielle de la règle de correspondance. L’entrée doit être basée sur Modifiez le mode de requête d’une table indexée.	Règle de correspondance partielle par défaut de l’index de texte	FAUX	VRAI
text_index _default_query_mode	Chaîne	Table	Les deux	Chaîne pour la configuration du mode requête. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée	Mode de requête par défaut de l’index de texte	FAUX	VRAI
text_index _disable_synonym	booléen	Table	Les deux	TRUE désactive la recherche sur les synonymes ainsi que sur le terme de recherche.	Index de texte : désactiver synonyme	FAUX	VRAI
text_index _enable_idf	booléen	Table	V3	TRUE active le score TF-IDF.	Activation des index de texte pour IDF	FAUX	VRAI
text_index _filter_junk	booléen	Table	Les deux	Par défaut, la valeur TRUE et FALSE désactive le filtre de courrier indésirable pour une table. Par défaut, Zing n’indexe pas et ne recherche pas les nombres à 2 chiffres et les mots à un seul caractère (sauf s’il s’agit de caractères chinois ou japonais). Régénérez l’index après avoir désactivé le filtre de courrier indésirable. Cet attribut génère un index de table plus grand. Pour des performances optimales, ne l’appliquez pas à moins que cela ne soit nécessaire.	Filtre d’index de texte indésirable	VRAI	VRAI
text_index _filter_query	Une requête encodedQuery sur la table	Table	Les deux	Utilisez cet attribut lorsque vous souhaitez indexer les lignes correspondant à des conditions de filtre spécifiques. La valeur d’attribut doit être encodedQuery sur la table.	Filtre d’index	VRAI	FAUX
text_index_filterable	booléen	Colonne	Les deux	Si un champ avec cet attribut défini sur true est modifié, la ligne est évaluée pour la réindexation (même si le champ lui-même n’est pas indexable).	Index filtrable	VRAI	FAUX
text_index_include _stop_word	booléen	Table	Les deux	Si vous avez besoin d’indexer les mots vides dans cette table, définissez cet attribut sur true.	Index de texte Inclure un mot vide	VRAI	VRAI
text_index_scorer_bm25_b	Flotteur	Table	V4	Cet attribut est le paramètre b utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_b.	bm25_b	FAUX	VRAI
text_index_scorer_bm25_k1	Flotteur	Table	V4	Cet attribut est le paramètre K1 utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_k1.	bm25_k1	FAUX	VRAI
text_index_tags	Chaîne	Table	Les deux	Doit être défini sur une chaîne spécifique : empty/everyone_only/all_shared, selon le type de balises qui veulent être indexées.	Balises d’index de texte	VRAI	FAUX
text_index_tokenizer _language	Chaîne	Table	Les deux	Mettez « ja » (sans guillemet) lorsqu’il est nécessaire de prendre en charge la tokenisation en japonais.	Langue du créateur de jetons d’index de texte	VRAI	VRAI
text_index_translations	booléen	Table	Les deux	Si présent ou vrai, force le recalcul des index lorsque des chaînes traduites sont ajoutées. Requiert un rôle sys-admin pour modification. Automatiquement défini pour les champs indexés qui sont traduits et pour les champs qui ont une traduction et qui sont indexés. La propriété système glide.i18n.force_index, définie par défaut sur true, remplace cet attribut.	Traductions d’index de texte	VRAI	FAUX
text_search_and_or_limit	int	Table	Les deux	Ajoutez un text_search_and_or_limit d’attribut personnalisé au niveau de la table qui remplace la propriété globale.	Recherche de texte Limite Et Ou	FAUX	FAUX
ts_language	Chaîne	Colonne	Les deux	Ajouté pour permettre l’indexation de texte uniquement dans certaines langues.	Langue de recherche de texte	VRAI	FAUX
ts_multi_value_field _splitter	Chaîne	Colonne	Les deux	Si un champ est un champ à plusieurs valeurs, ajoutez le séparateur dans le champ de cet attribut pour répartir les positions d’index des valeurs. Par exemple, pour séparer multi :value, mettez : pour cet attribut.	Séparateur de champs à valeurs multiples de recherche de texte	VRAI	VRAI
ts_weight	int	Colonne	Les deux	Contrôle l’importance relative d’une correspondance dans le champ pour la recherche de texte. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. Pour apprendre à définir le poids d’une recherche textuelle pour un champ, reportez-vous à la section Définir le poids relatif d’un champ.	Poids de la recherche de texte	FAUX	FAUX

no_text_index

Pour obtenir Service et assistance client des instructions sur la définition de l’option no_text_index pour différents types de champs, consultez KB0859922 sur le Now Support site.

text_index_scorer_bm25_b

Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut a une incidence sur l’importance de la longueur d’un document dans les résultats de recherche. Si cet attribut est 0, la longueur n’a pas de repère. Dans ce cas, un document de deux mots aurait la même valeur qu’un document de 1000 mots. Les documents très courts ont souvent une pondération inférieure à celle des documents plus longs. La valeur par défaut est 0,75.

text_index_scorer_bm25_k1

Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut aide à déterminer les caractéristiques de saturation de fréquence des termes, c’est-à-dire que l’affichage du terme de recherche dans un document augmente la pertinence du document, mais l’augmentation a moins d’impact à mesure que les chiffres augmentent. Par exemple, un terme de recherche apparaissant 10 fois dans un document le rend plus pertinent qu’un document qui n’a qu’une seule occurrence. Cependant, un document qui a 100 occurrences du terme de recherche peut ne pas avoir dix fois plus d’impact qu’un document qui a 10 occurrences. La pertinence se rapproche d’un effet maximal asymptote. Plus la valeur de l’attribut est élevée, plus l’effet maximal des occurrences multiples est faible. Les valeurs typiques se situent entre 1,25 et 2,0.