Activer le modèle d’incorporation personnalisé pour l’indexation sémantique

  • Rversion finale: Zurich
  • Mis à jour 31 juil. 2025
  • 1 minute de lecture
  • Ajoutez un nouveau modèle d’incorporation dans la table d’indexation sémantique afin que l’application (RAG) puisse utiliser ce modèle pour l’indexation Recherche IA Génération augmentée de récupération (RAG) sémantique.

    Avant de commencer

    Rôle requis : admin

    Procédure

    1. Accédez à la Tous, puis entrez ais_semantic_embedding_model.list dans le filtre pour accéder à la table Modèles d’intégration Recherche IA sémantique [sys_generative_ai_config].
    2. Sélectionnez Nouveau.
    3. Dans le champ Nom , saisissez un nom unique.
      Par exemple, l’incorporation Azure OpenAI de texte volumineux.
    4. Dans le champ ID de modèle , entrez un ID unique.
      Un ID commence par une lettre ou un chiffre et peut inclure des lettres, des chiffres, des points (.) ou des traits d’union (-) après le premier caractère.
    5. Dans le champ Définition d’option OneExtend , sélectionnez une définition d’aptitude BYOM que vous avez créée pour définir un fournisseur pour le modèle d’incorporation.
    6. Dans le champ Configuration du modèle , sélectionnez un modèle d’incorporation qui est déjà configuré.
    7. Sélectionnez Actif.
    8. Facultatif : Si vous souhaitez configurer le traitement par lots pour votre modèle d’incorporation, procédez comme suit :
      Le traitement par lots permet au modèle d’incorporation de traiter plusieurs entrées à la fois. Les valeurs de taille de lot minimale et maximale contrôlent la façon dont les entrées sont regroupées et traitées pour appeler l’API de génération d’intégration.
      1. Sélectionnez le traitement par lots pris en charge.
      2. Dans les champs Taille minimale du lot et Taille maximale du lot , saisissez les valeurs requises.
        Par exemple, le nombre minimal d’entrées autorisées dans un seul lot est de 4 et le nombre maximal d’entrées pouvant être traitées ensemble dans un lot est de 16.
    9. Dans le champ Instance d’extension du gestionnaire d’erreurs , sélectionnez une instance de gestionnaire d’erreurs.
      Vous créez un point d’extension scripté pour gérer les erreurs de génération d’incorporation qui se produisent lorsque les modèles d’incorporation personnalisés génèrent des vecteurs sémantiques. Pour plus d'informations, consultez Créer un point d’extension de gestionnaire d’erreurs.
    10. Sélectionnez Soumettre.

    Que faire ensuite

    Ajoutez votre modèle d’incorporation à la configuration de l’index sémantique pour activer l’ingestion de contenu avec ce modèle. Pour plus d'informations, consultez Configurer les paramètres d’indexation sémantique pour une source indexée.