Attributs d’index Zing et de dictionnaire de recherche

  • Rversion finale: Washingtondc
  • Mis à jour 7 févr. 2024
  • 6 minutes de lecture
  • Les attributs de dictionnaire suivants affectent la façon dont Zing indexe les tables ou classe les résultats de recherche.

    Attributs d’index et de dictionnaire de recherche

    Zing utilise des attributs de dictionnaire définis au niveau de la table ou du champ pour configurer les paramètres suivants :
    • Comportement d’indexation
    • Classement des résultats de recherche
    • l’algorithme de classement par pertinence BM25
    Tableau 1. Attributs d’index Zing et de dictionnaire de recherche
    Nom Type de données Concerne S’applique à V3 ou V4 Description Étiquette Besoin d’une réindexation ? Table racine uniquement
    attachment_index booléen Table Les deux Si vrai, les pièces jointes de la table sont indexées à des fins de recherche. Index de la pièce jointe VRAI FAUX
    no_text_index booléen Les deux Les deux Cet attribut sur un champ empêche le champ d’être inclus dans un index de texte. Aucun index de texte VRAI FAUX
    text_index _attachment_body _weight Flotteur Table V4 Spécifie la contrepartie (poids, valeur flottante) à accorder à un terme de recherche trouvé dans le corps d’une pièce jointe. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. Poids du corps de la pièce jointe d’index de texte FAUX VRAI
    text_index _attachment_displayed booléen Table Les deux Affiche les pièces jointes dans les résultats de recherche de texte. Index de texte : pièce jointe affichée FAUX FAUX
    text_index_attachment _title_weight Flotteur Table V4 Spécifie la contrepartie (poids, valeur flottante) à accorder à un terme de recherche trouvé dans le titre d’une pièce jointe. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. Index de texte Poids du titre de la pièce jointe FAUX VRAI
    text_index _auto_stop booléen Table Les deux Identifie automatiquement les mots vides et ne les indexe pas. En fonction du seuil spécifié dans text_index_auto_stop_threshold. Arrêt automatique des index de texte VRAI VRAI
    text_index_auto _stop_threshold int Table Les deux Seuil (nombre entier, nombre d’occurrences) pour qu’un mot devienne automatiquement un mot vide. Voir text_index_auto_stop. Seuil d’arrêt automatique des index de texte VRAI VRAI
    text_index_default _partial_matching_rule Chaîne Table Les deux Chaîne pour la configuration partielle de la règle de correspondance. L’entrée doit être basée sur Modifiez le mode de requête d’une table indexée. Règle de correspondance partielle par défaut de l’index de texte FAUX VRAI
    text_index _default_query_mode Chaîne Table Les deux Chaîne pour la configuration du mode requête. L’entrée doit être basée sur Modifier le mode de requête d’une table indexée Mode de requête par défaut de l’index de texte FAUX VRAI
    text_index _disable_synonym booléen Table Les deux TRUE désactive la recherche sur les synonymes ainsi que sur le terme de recherche. Index de texte : désactiver synonyme FAUX VRAI
    text_index _enable_idf booléen Table V3 TRUE active le score TF-IDF. Activation des index de texte pour IDF FAUX VRAI
    text_index _filter_junk booléen Table Les deux Par défaut, la valeur TRUE et FALSE désactive le filtre de courrier indésirable pour une table. Par défaut, Zing n’indexe pas et ne recherche pas les nombres à 2 chiffres et les mots à un seul caractère (sauf s’il s’agit de caractères chinois ou japonais). Régénérez l’index après avoir désactivé le filtre de courrier indésirable. Cet attribut génère un index de table plus grand. Pour des performances optimales, ne l’appliquez pas à moins que cela ne soit nécessaire. Filtre d’index de texte indésirable VRAI VRAI
    text_index _filter_query Une requête encodedQuery sur la table Table Les deux Utilisez cet attribut lorsque vous souhaitez indexer les lignes correspondant à des conditions de filtre spécifiques. La valeur d’attribut doit être encodedQuery sur la table. Filtre d’index VRAI FAUX
    text_index_filterable booléen Colonne Les deux Si un champ avec cet attribut défini sur true est modifié, la ligne est évaluée pour la réindexation (même si le champ lui-même n’est pas indexable). Index filtrable VRAI FAUX
    text_index_include _stop_word booléen Table Les deux Si vous avez besoin d’indexer les mots vides dans cette table, définissez cet attribut sur true. Index de texte Inclure un mot vide VRAI VRAI
    text_index_scorer_bm25_b Flotteur Table V4 Cet attribut est le paramètre b utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_b. bm25_b FAUX VRAI
    text_index_scorer_bm25_k1 Flotteur Table V4 Cet attribut est le paramètre K1 utilisé dans l’algorithme BM25. Voir text_index_scorer_bm25_k1. bm25_k1 FAUX VRAI
    text_index_tags Chaîne Table Les deux Doit être défini sur une chaîne spécifique : empty/everyone_only/all_shared, selon le type de balises qui veulent être indexées. Balises d’index de texte VRAI FAUX
    text_index_tokenizer _language Chaîne Table Les deux Mettez « ja » (sans guillemet) lorsqu’il est nécessaire de prendre en charge la tokenisation en japonais. Langue du créateur de jetons d’index de texte VRAI VRAI
    text_index_translations booléen Table Les deux Si présent ou vrai, force le recalcul des index lorsque des chaînes traduites sont ajoutées. Requiert un rôle sys-admin pour modification. Automatiquement défini pour les champs indexés qui sont traduits et pour les champs qui ont une traduction et qui sont indexés. La propriété système glide.i18n.force_index, définie par défaut sur true, remplace cet attribut. Traductions d’index de texte VRAI FAUX
    text_search_and_or_limit int Table Les deux Ajoutez un text_search_and_or_limit d’attribut personnalisé au niveau de la table qui remplace la propriété globale. Recherche de texte Limite Et Ou FAUX FAUX
    ts_language Chaîne Colonne Les deux Ajouté pour permettre l’indexation de texte uniquement dans certaines langues. Langue de recherche de texte VRAI FAUX
    ts_multi_value_field _splitter Chaîne Colonne Les deux Si un champ est un champ à plusieurs valeurs, ajoutez le séparateur dans le champ de cet attribut pour répartir les positions d’index des valeurs. Par exemple, pour séparer multi :value, mettez : pour cet attribut. Séparateur de champs à valeurs multiples de recherche de texte VRAI VRAI
    ts_weight int Colonne Les deux Contrôle l’importance relative d’une correspondance dans le champ pour la recherche de texte. Pour en savoir plus sur l’impact de la valeur pondérée sur la pertinence des résultats de recherche, reportez-vous à Zing calcule les scores des documents à l’aide de trois composants :. Pour apprendre à définir le poids d’une recherche textuelle pour un champ, reportez-vous à la section Définir le poids relatif d’un champ. Poids de la recherche de texte FAUX FAUX

    no_text_index

    Pour obtenir Service et assistance client des instructions sur la définition de l’option no_text_index pour différents types de champs, consultez KB0859922 sur le Now Support site.

    text_index_scorer_bm25_b

    Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut a une incidence sur l’importance de la longueur d’un document dans les résultats de recherche. Si cet attribut est 0, la longueur n’a pas de repère. Dans ce cas, un document de deux mots aurait la même valeur qu’un document de 1000 mots. Les documents très courts ont souvent une pondération inférieure à celle des documents plus longs. La valeur par défaut est 0,75.

    text_index_scorer_bm25_k1

    Cet attribut de dictionnaire fait partie de l’algorithme BM25. L’attribut aide à déterminer les caractéristiques de saturation de fréquence des termes, c’est-à-dire que l’affichage du terme de recherche dans un document augmente la pertinence du document, mais l’augmentation a moins d’impact à mesure que les chiffres augmentent. Par exemple, un terme de recherche apparaissant 10 fois dans un document le rend plus pertinent qu’un document qui n’a qu’une seule occurrence. Cependant, un document qui a 100 occurrences du terme de recherche peut ne pas avoir dix fois plus d’impact qu’un document qui a 10 occurrences. La pertinence se rapproche d’un effet maximal asymptote. Plus la valeur de l’attribut est élevée, plus l’effet maximal des occurrences multiples est faible. Les valeurs typiques se situent entre 1,25 et 2,0.