Index Zing et attributs du dictionnaire de recherche

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 6 minutes de lecture
  • Les attributs de dictionnaire suivants affectent la façon dont Zing indexe les tables ou classe les résultats de recherche.

    Indexer et rechercher les attributs du dictionnaire

    Zing utilise les attributs de dictionnaire définis au niveau de la table ou du champ pour configurer les paramètres suivants :
    • Comportement d’indexation
    • Classement des résultats de recherche
    • l’algorithme de classement par pertinence BM25
    Tableau 1. Index Zing et attributs du dictionnaire de recherche
    Nom Type de données Concerne S’applique à V3 ou V4 Description Étiquette Besoin d’une réindexation ? Table racine uniquement
    attachment_index booléen Table Les deux Si vrai, les pièces jointes de la table sont indexées à des fins de recherche. Index des pièces jointes VRAI FAUX
    no_text_index booléen Les deux Les deux Cet attribut sur un champ empêche l’inclusion du champ dans un index de texte. Aucun index de texte VRAI FAUX
    text_index _attachment_body _weight flottant Table V4 Spécifie le degré de considération (poids, valeur flottante) à donner à un terme de recherche trouvé dans le corps d’une pièce jointe. Pour en savoir plus sur l’incidence de la valeur de poids sur la pertinence des résultats de recherche, reportez-vous à la section Zing calcule les scores des documents à l’aide de trois composants. Poids du corps de la pièce jointe d’index de texte FAUX VRAI
    text_index _attachment_displayed booléen Table Les deux Affiche les pièces jointes dans les résultats de recherche de texte. Pièce jointe d’index de texte affichée FAUX FAUX
    text_index_attachment _title_weight flottant Table V4 Spécifie le degré de considération (poids, valeur flottante) à donner à un terme de recherche trouvé dans le titre d’une pièce jointe. Pour en savoir plus sur l’incidence de la valeur de poids sur la pertinence des résultats de recherche, reportez-vous à la section Zing calcule les scores des documents à l’aide de trois composants. Poids du titre de la pièce jointe d’index de texte FAUX VRAI
    text_index _auto_stop booléen Table Les deux Identifie automatiquement les mots vides et ne les indexe pas. En fonction du seuil spécifié dans text_index_auto_stop_threshold. Arrêt automatique de l’index de texte VRAI VRAI
    text_index_auto _stop_threshold int Table Les deux Seuil (nombre entier, nombre d’occurrences) pour qu’un mot devienne automatiquement un mot vide. Voir text_index_auto_stop. Seuil d’arrêt automatique des index de texte VRAI VRAI
    text_index_default _partial_matching_rule Chaîne Table Les deux Chaîne pour la configuration de la règle de correspondance partielle. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée. Règle de correspondance partielle par défaut de l’index de texte FAUX VRAI
    text_index _default_query_mode Chaîne Table Les deux Chaîne pour la configuration en mode requête. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée Mode de requête par défaut d’index de texte FAUX VRAI
    text_index _disable_synonym booléen Table Les deux VRAI désactive la recherche sur les synonymes ainsi que sur le terme recherché. Index de texte Désactiver le synonyme FAUX VRAI
    text_index _enable_idf booléen Table V3 TRUE active le score TF-IDF. Index de texte Activer IDF FAUX VRAI
    text_index _filter_junk booléen Table Les deux TRUE par défaut, FALSE désactive le filtre de courrier indésirable pour une table. Par défaut, Zing n’indexe pas et ne recherche pas les nombres à 2 chiffres et les mots à un seul caractère (sauf s’il s’agit de caractères chinois ou japonais). Régénérez l’index après avoir désactivé le filtre indésirable. Cet attribut entraîne un index de table plus grand. Pour des performances optimales, ne l’appliquez que si cela est nécessaire. Courrier indésirable du filtre d’index de texte VRAI VRAI
    text_index _filter_query Une encodedQuery sur la table Table Les deux Utilisez cet attribut lorsque vous souhaitez indexer les lignes correspondant à des conditions de filtre spécifiques. La valeur de l’attribut doit être une encodedQuery dans la table. Filtre d’index VRAI FAUX
    text_index_filterable booléen Colonne Les deux Si un champ avec cet attribut défini sur vrai est modifié, la ligne est évaluée pour réindexation (même si le champ lui-même n’est pas indexable). Filtrable d’index VRAI FAUX
    text_index_include _stop_word booléen Table Les deux Si vous devez indexer les mots vides dans cette table, définissez cet attribut sur vrai. Inclure un mot vide d’index de texte VRAI VRAI
    text_index_scorer_bm25_b flottant Table V4 Cet attribut est le paramètre b utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_b. bm25_b FAUX VRAI
    text_index_scorer_bm25_k1 flottant Table V4 Cet attribut est le paramètre K1 utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_k1. bm25_k1 FAUX VRAI
    text_index_tags Chaîne Table Les deux Doit être défini sur chaîne spécifique : empty/everyone_only/all_shared, selon le type de balises à indexer. Balises d’index de texte VRAI FAUX
    text_index_tokenizer _language Chaîne Table Les deux Mettez « ja » (sans guillemets doubles) lorsqu’il est nécessaire de prendre en charge la tokenisation en japonais. Langue du créateur de jetons d’index de texte VRAI VRAI
    text_index_translations booléen Table Les deux Si la valeur est présente ou vraie, force le recalcul des index lors de l’ajout de chaînes traduites. Nécessite un rôle sys-admin pour modifier. Défini automatiquement pour les champs indexés qui sont traduits et pour les champs qui ont une traduction et sont en cours d’indexation. La propriété système glide.i18n.force_index, définie par défaut sur true, remplace cet attribut. Traductions d’index de texte VRAI FAUX
    text_search_and_or_limit int Table Les deux Ajoutez un attribut personnalisé au niveau de la table text_search_and_or_limit qui remplace la propriété globale. Recherche de texte et ou limite FAUX FAUX
    ts_language Chaîne Colonne Les deux Ajouté pour permettre l’indexation de texte uniquement dans certaines langues. Langue de recherche de texte VRAI FAUX
    ts_multi_value_field _splitter Chaîne Colonne Les deux Si un champ est un champ à valeurs multiples, ajoutez le séparateur dans le champ de cet attribut pour répartir les positions d’index des valeurs. Par exemple, pour séparer multi :value, mettez : pour cet attribut. Séparateur de champ à valeurs multiples de la recherche de texte VRAI VRAI
    ts_weight int Colonne Les deux Contrôle l’importance relative d’une correspondance dans le champ pour la recherche de texte. Pour en savoir plus sur l’incidence de la valeur de poids sur la pertinence des résultats de recherche, reportez-vous à la section Zing calcule les scores des documents à l’aide de trois composants. Pour savoir comment définir la pondération de la recherche de texte pour un champ, reportez-vous à la section Définir le poids relatif d’un champ. Poids de la recherche de texte FAUX FAUX

    no_text_index

    Pour Service et assistance client obtenir des instructions sur la définition de l’option no_text_index pour différents types de champs, consultez KB0859922 sur le Now Support site.

    text_index_scorer_bm25_b

    Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut a une incidence sur l’importance de la longueur d’un document dans les résultats de recherche. Si cet attribut est 0, la longueur n’a pas de relèvement. Dans ce cas, un document de deux mots aurait la même valeur qu’un document de 1000 mots. Les documents très courts sont souvent moins pondérés que les documents plus longs. La valeur par défaut est 0,75.

    text_index_scorer_bm25_k1

    Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut permet de déterminer les caractéristiques de saturation de la fréquence des termes. En d’autres termes, l’apparition du terme de recherche dans un document augmente la pertinence du document, mais l’augmentation a moins d’impact à mesure que les chiffres augmentent. Par exemple, un terme de recherche apparaissant 10 fois dans un document le rend plus pertinent qu’un document qui n’a qu’une seule occurrence. Cependant, un document qui a 100 occurrences du terme de recherche peut ne pas avoir dix fois plus d’impact qu’un document qui a 10 occurrences. La pertinence se rapproche d’une asymptote à effet maximal. Plus la valeur de l’attribut est élevée, plus l’effet maximal des occurrences multiples est faible. Les valeurs typiques sont comprises entre 1,25 et 2,0.