Activer le modèle d’incorporation personnalisé pour l’indexation sémantique

Administration de la plateforme IA ServiceNow Zurich

Release

zurich

ft:locale

fr-FR

ft:publication_title

Administration de la plateforme IA ServiceNow Zurich

ft:clusterId

platadm

bundleId

platadm

workflow

Platform

Activer le modèle d’incorporation personnalisé pour l’indexation sémantique

Rversion finale: Zurich

Mis à jour 31 juil. 2025

1 minute de lecture

Ajoutez un nouveau modèle d’incorporation dans la table d’indexation sémantique afin que l’application (RAG) puisse utiliser ce modèle pour l’indexation Recherche IA Génération augmentée de récupération (RAG) sémantique.

Avant de commencer

Rôle requis : admin

Procédure

Accédez à la Tous, puis entrez ais_semantic_embedding_model.list dans le filtre pour accéder à la table Modèles d’intégration Recherche IA sémantique [sys_generative_ai_config].
Sélectionnez Nouveau.
Dans le champ Nom , saisissez un nom unique.
Par exemple, l’incorporation Azure OpenAI de texte volumineux.
Dans le champ ID de modèle , entrez un ID unique.
Un ID commence par une lettre ou un chiffre et peut inclure des lettres, des chiffres, des points (.) ou des traits d’union (-) après le premier caractère.
Dans le champ Définition d’option OneExtend , sélectionnez une définition d’aptitude BYOM que vous avez créée pour définir un fournisseur pour le modèle d’incorporation.
Dans le champ Configuration du modèle , sélectionnez un modèle d’incorporation qui est déjà configuré.
Sélectionnez Actif.
Facultatif : Si vous souhaitez configurer le traitement par lots pour votre modèle d’incorporation, procédez comme suit :
Le traitement par lots permet au modèle d’incorporation de traiter plusieurs entrées à la fois. Les valeurs de taille de lot minimale et maximale contrôlent la façon dont les entrées sont regroupées et traitées pour appeler l’API de génération d’intégration.
1. Sélectionnez le traitement par lots pris en charge.
2. Dans les champs Taille minimale du lot et Taille maximale du lot , saisissez les valeurs requises.
  Par exemple, le nombre minimal d’entrées autorisées dans un seul lot est de 4 et le nombre maximal d’entrées pouvant être traitées ensemble dans un lot est de 16.
Dans le champ Instance d’extension du gestionnaire d’erreurs , sélectionnez une instance de gestionnaire d’erreurs.
Vous créez un point d’extension scripté pour gérer les erreurs de génération d’incorporation qui se produisent lorsque les modèles d’incorporation personnalisés génèrent des vecteurs sémantiques. Pour plus d'informations, consultez Créer un point d’extension de gestionnaire d’erreurs.
Sélectionnez Soumettre.

Que faire ensuite

Ajoutez votre modèle d’incorporation à la configuration de l’index sémantique pour activer l’ingestion de contenu avec ce modèle. Pour plus d'informations, consultez Configurer les paramètres d’indexation sémantique pour une source indexée.