Directives pour les segments
Suivez ces suggestions pour vous aider à utiliser efficacement les segments de la couche sémantique.
Directives générales pour les segments
- Testez des segments en posant des questions en langage naturel qui doivent correspondre à eux. Le segment doit apparaître dans .
- Surveillez les journaux de requêtes pour vérifier que les segments sont correctement mis en correspondance et pour identifier les segments les plus précieux.
- Désactivez les segments générés automatiquement bruyants plutôt que d’essayer de les surajuster avec plusieurs segments manuels.
- Utilisez une formulation naturelle qui correspond à la façon dont vos utilisateurs parlent réellement.
- Gardez un segment par concept pour éviter toute confusion.
- Affiner les noms et les descriptions des segments en fonction des commentaires des utilisateurs et des modèles d’utilisation
- Envisagez de créer des segments manuels pour les questions récurrentes qui ne sont pas bien gérées par les segments existants.
Directives pour les segments manuels
Les segments manuels sont le moyen recommandé d’envoyer des recherches enregistrées spécifiques à un domaine avec votre application. Ils reçoivent un boost de priorité par rapport aux segments automatisés pendant la recherche, et le LLM a pour instruction de conserver tous leurs filtres, sauf s’ils ne sont pas complètement pertinents.
- Commencez par des tables à forte valeur ajoutée et à trafic élevé
- Concentrez les segments manuels sur les tables sur lesquelles vos utilisateurs demandent le plus. Une poignée de segments bien conçus sur l’incident, le sc_req_item ou la table primaire de votre application auront plus d’impact qu’une couverture étendue dans des tables rarement interrogées.
- Associez chaque filtre riche en choix avec un nom clair
- Si votre segment filtre sur des valeurs de choix, par exemple,
état=6^priorité<=2), le nom du segment doit traduire ces codes en langage métier. Le LLM correspond au nom, pas au filtre. « Incidents critiques et élevés résolus » peut faire l’objet d’une recherche, maisétat=6^priorité<=2ne l’est pas. - Utiliser des descriptions pour lever l’ambiguïté des segments similaires
- Si vous expédiez plusieurs segments pour la même table, par exemple, « Incidents ouverts » et « Incidents critiques ouverts », les descriptions sont ce qui aide le LLM à choisir le bon. Sans description, le LLM peut choisir arbitrairement entre deux correspondances proches.
- Garder les filtres ciblés
- Un segment avec 15 conditions de filtre est difficile à raisonner pour le LLM et est susceptible d’être tronqué. Si vous avez un cas d’utilisation complexe, divisez-le en plusieurs segments avec des filtres plus simples. Le LLM peut combiner des filtres de différents segments lors de la création d’une requête.
- Compléter les descriptions sémantiques par des segments
- Les segments manuels et les descriptions sémantiques (configuration entité/colonne) fonctionnent ensemble. Les descriptions aident le LLM à comprendre ce que représentent une table et ses colonnes. Les segments aident le LLM à comprendre comment les utilisateurs filtrent généralement cette table. Pour de meilleurs résultats, expédiez les deux.
- Éviter de dupliquer les segments automatisés
- Avant de créer un segment manuel, vérifiez si un segment automatisé couvre déjà le même filtre. Si l’un d’entre eux a une mauvaise réputation, demandez-vous si l’amélioration de la source – par exemple, renommer le rapport – est une meilleure approche que la création d’un segment manuel en double.
- Examiner après le déploiement
- Après l’expédition, surveillez les segments correspondants et si les requêtes générées sont correctes. Si un segment correspond mais produit des résultats erronés, le problème est généralement que le nom est trop générique ou que le filtre est trop large. Itérez d’abord sur le nom et la description avant d’ajuster les propriétés système.
Suggestions de réglage des propriétés
Utilisez ces suggestions pour ajuster les propriétés système lorsque les segments ne fonctionnent pas comme prévu. Pour obtenir la liste complète de toutes les propriétés de segment et de leurs valeurs par défaut, reportez-vous à la section Propriétés de la génération de requête.
- Les segments ne correspondent pas aux questions des utilisateurs
- inférieur segments_match_threshold (par exemple, réglez-le sur
0,60). La valeur par défautde 0,70peut être trop stricte pour une terminologie spécifique à un domaine où la formulation de l’utilisateur diffère du nom du segment. Commencez plus bas et serrez une fois que vous avez suffisamment de segments. - Les segments manuels sont éclipsés par les segments automatisés
- L’augmentation manual_segment_scale_factor donne aux segments manuels un avantage plus fort, mais une augmentation plus élevée ne signifie pas nécessairement de meilleurs résultats. Un segment manuel mal nommé mis en avant par rapport à un segment automatisé véritablement pertinent dégrade la qualité de la requête. Avant d’ajuster le boost, vérifiez d’abord si le nom et la description du segment manuel sont bien écrits. C’est généralement la vraie solution. N’augmentez le facteur que si vous êtes sûr que vos segments manuels sont de haute qualité et qu’ils perdent toujours face à des correspondances automatisées plus faibles.
- Trop de segments non pertinents dans l’invite LLM
- inférieur segments_result_limit (par exemple,
6ou8). Moins de segments dans l’invite signifie moins de bruit pour le LLM, mais aussi moins de couverture. Trouvez l’équilibre pour votre domaine. Vous pouvez également relancer segments_match_threshold si vous voyez des correspondances de mauvaise qualité passer entre les mailles du filet. - Filtres longs en cours de troncature
- Augmentez max_filter_length si vos segments nécessitent des filtres complexes. Sachez que les filtres plus longs consomment une plus grande partie de la fenêtre de contexte du LLM et peuvent réduire la qualité globale de la génération. Envisagez plutôt de fractionner un segment complexe en plusieurs segments ciblés.
- La recherche par lots est désactivée et les segments manuels n’apparaissent pas
- Activez la Recherche IA propriété segments.ais_batch_fetch_enabled. Sans recherche par lots, les segments manuels et automatisés se disputent les mêmes emplacements de résultats. La recherche par lots donne à chaque type une recherche dédiée, ce qui améliore considérablement la couverture manuelle des segments.