Formulaire de configuration d’index sémantique

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 3 minutes de lecture
  • Le formulaire Configuration d’index sémantique contient des informations sur les paramètres d’indexation sémantique d’une Recherche IA source indexée. Utilisez ce formulaire lors de la définition ou de la modification des paramètres d’indexation sémantique d’une source indexée.

    Pour plus d’informations sur la définition et la modification des paramètres d’indexation sémantique d’une source indexée, reportez-vous à la section Configurer les paramètres d’indexation sémantique pour une source indexée.
    Remarque :
    Ce formulaire n’est disponible que lorsque le Module d’extension Recherche IA Contrôleur sémantique (com.glide.ais.semantic_search) est actif sur votre instance. Pour activer ce module d’extension, votre instance doit avoir au moins un Now Assist l'application Installé.
    Tableau 1. Formulaire de configuration d’index sémantique
    Champ Description
    Nom Nom unique de l’index sémantique généré par cette configuration d’index sémantique. Par exemple, si vous créez une configuration d’index sémantique pour la source indexée de la table de connaissances, vous pouvez l’appeler Knowledge-Table-semantic-index.
    Remarque :
    Le nom de l’index sémantique ne peut pas contenir de caractères spéciaux, de traits de soulignement ou d’espaces.
    Modèles d'incorporation Liste des modèles d’incorporation à utiliser pour la configuration de l’index sémantique.
    • Valeur par défaut: ServiceNow Embedding (E5)
    • Valeurs prises en charge :
      • ServiceNow Embedding (E5): utilisez le modèle d’intégration affiné E5 pour le contenu de l’index sémantique. La limite d’encodeur du modèle d’incorporation est de 512 termes.
    Actif Option permettant d’activer la configuration d’index sémantique pour votre instance. Recherche IA Ignore les configurations d’index sémantiques inactives lors de l’indexation du contenu à partir de la source d’index spécifiée.
    Source indexée

    Référence à la source indexée à laquelle Recherche IA vous souhaitez appliquer cette configuration d’index sémantique. Ce champ est automatiquement défini.

    Pour plus de détails sur les sources indexées, reportez-vous à la section Sources indexées.

    Demande Périmètre de l’application pour l’enregistrement de configuration de l’index sémantique. Ce champ est automatiquement défini.
    Configuration du découpage pour l'incorporation
    Stratégie de découpage Stratégie à utiliser lors du découpage de texte indexé sémantiquement pour le modèle d’incorporation.
    • Valeur par défaut: Passage
    • Valeurs prises en charge :
      • Passage: stratégie de mise en bloc pour les valeurs de champ de texte plus longues. Indexez le texte à partir des valeurs de champ sémantiques par blocs. Chaque morceau contient un nombre maximum de mots ou de phrases déterminé par vos Chunk Unit sélections et Chunk Size .
      • Truncate: stratégie de mise en bloc pour les valeurs de champ de texte courtes. Concaténez toutes les valeurs de champ d’index sémantique, puis procédez à une indexation sémantique pour les termes jusqu’à la Maximum Total Words limite.
      • Full Text: stratégie de mise en bloc pour les valeurs de champ de texte courtes. Concaténez tous les champs d’index sémantique, puis effectuez une indexation sémantique pour tous les termes jusqu’à la limite d’encodeur du modèle d’incorporation.
    • Type : choix
    Phrases de chevauchement

    Nombre de phrases à chevaucher entre les blocs lors de l’indexation du texte à partir des valeurs de champ d’index sémantique. Des valeurs de chevauchement plus élevées augmentent le rappel pour la recherche vectorielle sémantique au détriment des performances.

    Ce champ n’apparaît que lorsque Passage est sélectionné dans .Chunking Strategy

    • Valeur par défaut : 5
    • Valeurs prises en charge : tout entier non négatif
    • Type : entier
    Unité de bloc

    Unité textuelle à utiliser comme base pour la taille du bloc lors de l’indexation des valeurs de champ sémantiques pour la recherche de vecteur sémantique.

    Ce champ n’apparaît que lorsque Passage est sélectionné dans .Chunking Strategy
    • Valeur par défaut: Words
    • Valeurs prises en charge :
      • Words: utiliser des mots comme unité textuelle par laquelle les valeurs des champs de l’index sémantique sont regroupées. Chaque morceau peut inclure jusqu’à des Chunk Size mots.
      • Sentences: utilisez les phrases comme unité textuelle par laquelle les valeurs de champ de l’index sémantique sont fragmentées. Chaque morceau peut inclure jusqu’à Chunk Size des phrases.
    • Type : choix
    Taille du bloc

    Nombre maximal de mots ou de phrases (en fonction de votre Chunk Unit sélection) à inclure dans un bloc lors de l’indexation des valeurs de champ sémantique pour la recherche vectorielle sémantique.

    Ce champ n’apparaît que lorsque Passage est sélectionné dans .Chunking Strategy
    • Valeur par défaut : 250 lorsqu’il Words est sélectionné dans Chunk Unit, ou 15 lorsqu’il Sentences est sélectionné dans Chunk Unit
    • Valeurs prises en charge : tout entier non négatif
    • Type : entier
    Total maximum de mots

    Nombre maximum de mots à indexer pour la recherche de vecteur sémantique à partir des valeurs concaténées de tous les champs d’index sémantique.

    Ce champ n’apparaît que lorsque Truncate est sélectionné dans .Chunking Strategy
    • Valeur par défaut : 500
    • Valeurs prises en charge : tout entier non négatif
    • Type : entier