Personnalisation des métadonnées sémantiques

  • Rversion finale: Australia
  • Mis à jour 17 avr. 2026
  • 6 minutes de lecture
  • Les métadonnées sémantiques (descriptions, étiquettes et instructions d’utilisation) contrôlent la façon dont Génération de requête les questions en langage naturel sont interprétées. Personnalisez ces métadonnées pour améliorer la précision de la terminologie et des données de votre organisation.

    Les entités (tables) et les dimensions (champs) de la couche sémantique ont trois champs de métadonnées qui Génération de requête sont utilisés lors du traitement d’une question :

    Étiquette sémantique
    Nom court ou alias de l’entité ou de la dimension. Fonctionne comme un mot clé de recherche qui aide Recherche IA à identifier la table ou le champ correct lorsque la question d’un utilisateur ne correspond pas à l’étiquette de champ par défaut.
    Description sémantique
    Description en langage naturel de ce que l’entité ou la dimension représente en termes commerciaux. Fournit un contexte qui aide le système à distinguer des tables ou des champs similaires.
    Instructions d'utilisation sémantique
    Instructions injectées directement dans l’invite LLM lorsque l’entité ou la dimension est sélectionnée. Apprend au système à interroger les données, par exemple, les opérateurs à utiliser, à gérer les abréviations ou à développer les valeurs hiérarchiques.

    Quand personnaliser

    Les métadonnées sont générées automatiquement et fonctionnent correctement dans leur état de base de référence. Personnalisez-le uniquement lorsque vous observez des problèmes cohérents et reproductibles :

    • Le système sélectionne la mauvaise table ou n’en trouve pas une. Modifier les descriptions et les étiquettes
    • Le mauvais champ est sélectionné ou un champ est manquant : modifier les descriptions et les étiquettes
    • Votre organisation utilise une terminologie différente de celle des étiquettes générées automatiquement : modifier les étiquettes
    • La table ou le champ de droite est sélectionné, mais la requête est construite de manière incorrecte. Modifier les instructions d’utilisation
    Remarque :
    Il existe des milliers de dimensions. N’essayez pas de tous les examiner. Concentrez-vous sur les champs qui apparaissent dans les requêtes ayant échoué.

    Deux méthodes de personnalisation des métadonnées

    Deux méthodes sont disponibles. La modification des tables de configuration est considérée comme l’approche par défaut.

    Tableau 1. Méthodes de personnalisation des métadonnées
    Méthode Tables Quand l’utiliser
    Modifier les enregistrements dans les tables Configuration de table sémantique et Configuration de colonne sémantique Configuration de table sémantique [sn_query_gen_table_config] et Configuration de colonne sémantique [sn_query_gen_column_config] Compatible avec les ensembles de mises à jour. Les personnalisations peuvent être incluses dans les ensembles de mises à jour et transférées entre les instances. Remplace les valeurs définies dans les tables Entité et Dimension. Prend en charge les descriptions d’entités et de dimensions ainsi que les instructions d’utilisation des dimensions. Ne prend pas en charge les étiquettes d’entité ni les instructions d’utilisation.
    Modifier les enregistrements dans les tables Entité et Dimension Entité [sn_query_gen_entity] et dimension [sn_query_gen_dimension] Plus simple. Convient pour le test sur une seule instance. Ces personnalisations ne peuvent pas être transférées entre les instances. Toutefois, il s’agit de la seule méthode pour modifier les étiquettes d’entité et les instructions d’utilisation au niveau de l’entité. Peut être remplacé par une mise à jour de la table à partir d’une mise à niveau.
    Remarque :
    Les deux méthodes nécessitent un rôle sn_query_gen.admin ou un rôle supérieur.

    Rédaction de descriptions efficaces

    Suivez ces directives lors de l’écriture de descriptions et d’étiquettes sémantiques :

    • Limitez les descriptions à 1 ou 2 phrases en vous concentrant sur la façon dont les utilisateurs se réfèrent à ces données
    • Incluez les synonymes et abréviations courants que diraient vos utilisateurs
    • Évitez les paragraphes entiers. Les descriptions concises correspondent mieux que les descriptions détaillées

    Rédaction d’instructions d’utilisation efficaces

    Suivez ces directives lors de la rédaction d’instructions d’utilisation sémantique :

    • Soyez précis et structuré. Inclure des règles, des exemples et des cas limites
    • Utilisez des étapes numérotées ou des sections étiquetées si la logique est complexe
    • Inclure des exemples de questions des utilisateurs et de définition de la forme que doit avoir la requête
    • Pour les champs de texte libre, spécifiez la stratégie de correspondance (CONTIENT, correspondance exacte) et les règles d’expansion
    • Garder les instructions centrées sur les besoins d’une entité ou d’un champ

    Instructions d’utilisation et Segments

    Les instructions d’utilisation apprennent au LLM à interroger un champ de manière dynamique, ce qui lui permet de gérer de nombreux scénarios en fonction de vos règles. Segmente les valeurs de filtres spécifiques en dur. Pour des champs tels que l’emplacement en texte libre, les instructions d’utilisation sont la bonne approche, car vous ne pouvez pas prédéfinir toutes les requêtes d’emplacement possibles. Les segments sont meilleurs pour une terminologie métier fixe telle que « Sev1 » = priorité 1.

    Description sémantique

    Pour une entité d’incident, au lieu d’utiliser uniquement « Table d’incidents », utilisez une description comme « Incidents informatiques, pannes, interruptions de service et tickets d’assistance informatique » pour inclure la terminologie que vos utilisateurs disent réellement.

    Conventions des données dans les instructions d’utilisation

    Pour un champ État qui stocke les abréviations :

    "Values in this field may be full state names or two-letter abbreviations (for example, 'California' or 'CA'). Always query for both forms. For country names, also include common aliases (for example, 'United Kingdom' OR 'UK')."

    Logique de requête complexe dans les instructions d’utilisation

    Ces instructions d’utilisation s’appliquent à un champ Emplacement approximatif en texte libre avec développement hiérarchique et gestion des synonymes :

    Champ : Emplacement approximatif : instruction d’utilisation
    Le champ Emplacement approximatif est une chaîne de texte libre non normalisée. Toutes les requêtes doivent utiliser une correspondance CONTAINS insensible à la casse et gérer l’expansion hiérarchique.
    Logique de requête principale
    1. Identifiez l’entité géographique (quartier, ville, état, pays, région ou continent).
    2. Développez des entités plus larges en listes explicites de sous-entités avant d’interroger.
    3. Utilisez la logique OU pour tous les termes et synonymes développés.
    Règles d’expansion
    • Continents : développez une liste de tous les principaux pays de ce continent.
    • Régions : Étendez-vous aux États ou pays pertinents (par exemple, « Côte atlantique » > NC, VA, FL, etc.).
    • États/Provinces : Incluez à la fois les noms complets et les abréviations standard (par exemple, « Caroline du Nord » OU « NC »).
    • Pays : incluez les alias courants (par exemple, « Royaume-Uni » OU « Royaume-Uni »).
    Modèle d’implémentation
    1. Extraire l’intention géographique.
    2. Classer le niveau de l’entité.
    3. Développer vers le bas (Continent > Pays) ou inclure des synonymes (État > Abréviation).
    4. Construisez une chaîne de requête unique à l’aide de filtres CONTAINS basés sur OR.

    Remarquez le modèle : l’instruction définit des règles et des exemples, et le LLM peut gérer de nombreuses requêtes connexes de manière dynamique en fonction des règles que vous fournissez. Vous enseignez la logique une fois, et le modèle l’applique à n’importe quelle entrée.

    Exemples de questions utilisateur converties en requêtes
    • Utilisateur : « Montrez-moi des choses au Japon » → Requête : l’emplacement CONTIENT « Japon »
    • Utilisateur : « Montrez-moi des choses dans les pays asiatiques » → Décomposition : Asie -> [Japon, Chine, Indonésie...] → Requête : l’emplacement CONTIENT « Japon » OU l’emplacement CONTIENT « Chine » OU l’emplacement CONTIENT « Indonésie »...

    • Utilisateur : « Montrez-moi des choses en Caroline du Nord » → Requête : l’emplacement CONTIENT « Caroline du Nord » OU l’emplacement CONTIENT « NC »
    • Utilisateur : « Montrez-moi tout en Europe » → Décomposition : Europe > [Royaume-Uni, Espagne, France, Allemagne...] → Requête : l’emplacement CONTIENT « ROYAUME-UNI » ou l’emplacement CONTIENT « Royaume-Uni » OU l’emplacement CONTIENT « Espagne » OU l’emplacement CONTIENT « France »...