Recherche IA Génération augmentée de récupération (RAG) (RAG)
Vous pouvez améliorer la précision de recherche de vos Recherche IA résultats à l’aide de l’application Recherche IA Génération augmentée de récupération (RAG) (RAG). Avec RAG, vous pouvez limiter l’accent d’un grand modèle de langage (LLM) à un ensemble de données contextuel spécifique, au lieu des données générales et générales sur lesquelles il a été formé.
Recherche IA RAG aperçu
RAG combine la récupération d’informations avec la génération de texte par l’IA. Cela fonctionne en deux étapes. Il indexe les données pour les rendre consultables, puis recherche ces données indexées à l’aide de requêtes.
L’efficacité de Recherche IA RAG repose sur son modèle d’intégration, qui est utilisé par les méthodes de recherche avancées, telles que la recherche sémantique ou vectorielle, pour récupérer les informations contextuelles à partir de sources indexées. Le modèle d’incorporation génère des intégrations basées sur la requête de recherche de l’utilisateur. Les intégrations sont ensuite utilisées par un LLM pour produire des réponses pertinentes. Le modèle d’intégration est le moteur derrière RAG qui lui permet de rechercher, de récupérer et d’intégrer des informations dans une carte vectorielle avant de les transmettre à un LLM. Par défaut, RAG utilise le modèle d’incorporation (E5), mais prend également en charge d’autres modèles tiers tels que l’incorporation et Google Gemini l’incorporationAzure OpenAI. Les utilisateurs peuvent également apporter leurs propres modèles d’intégration personnalisés de fournisseurs tiers pour créer des intégrations adaptées à leurs besoins spécifiques RAG .
Activation Recherche IA RAG
Recherche IA RAG La fonctionnalité est fournie par le module d’extension Recherche IA RAG (sn_ais_rag). Ce module d’extension est automatiquement activé pour votre instance lorsque vous installez le contrôleur d’IA générative ou tout autre Now Assist l'application.