Configurer les paramètres d’analyse pour un connecteur de Amazon S3 contenu externe

  • Rversion finale: Zurich
  • Mis à jour 30 juil. 2025
  • 3 minutes de lecture
  • Définissez des filtres d’inclusion et d’exclusion pour spécifier les catégories et les types de fichiers que votre Amazon S3 connecteur de contenu externe doit récupérer lors de l’exécution d’analyses de contenu.

    Avant de commencer

    Un administrateur doit déjà avoir créé le connecteur de contenu externe pour lequel vous souhaitez configurer les Amazon S3 paramètres d’analyse. Pour en savoir plus sur cette procédure, reportez-vous à la section Créer un connecteur de Amazon S3 contenu externe.

    Rôle requis : ais_admin

    Pourquoi et quand exécuter cette tâche

    Cette tâche est facultative. Par défaut, le Amazon S3 connecteur de contenu externe analyse toutes les catégories et tous les types de fichiers à partir de son système source spécifié et envoie les fichiers avec toutes les extensions prises en charge à l’indexation Recherche IA . Vous ne devez effectuer cette tâche que si vous souhaitez que le connecteur utilise l’un des paramètres autres que par défaut suivants :
    • Filtres d’inclusion ou d’exclusion pour les compartiments à prendre en compte lors de l’exécution d’analyses de contenu
    • Filtres d’inclusion ou d’exclusion pour les extensions de fichier à récupérer lors de l’exécution d’analyses de contenu
    Important :

    Par défaut, un connecteur de contenu externe peut indexer jusqu’aux un million (1 000 000) documents de son système source. Lorsqu’un connecteur dépasse cette limite, il continue d’analyser le système source, mais envoie uniquement des suppressions et des mises à jour de documents à des fins d’indexation Recherche IA , ignorant les nouveaux documents. Le connecteur enregistre un message d’erreur pour chaque tranche de 10 000 documents qu’il analyse au-delà de la limite d’indexation.

    Lorsque le nombre de documents indexés d’un connecteur dépasse 800 000, un message d’avertissement s’affiche dans l’interface utilisateur du connecteur pour indiquer qu’il approche de la limite d’indexation. Si le connecteur atteint la limite d’indexation, un message d’erreur s’affiche dans son interface utilisateur.

    Si l’un de vos connecteurs atteint la limite d’indexation, vous pouvez mettre à jour ses paramètres d’analyse et ses filtres d’inclusion/exclusion de fichiers pour réduire le nombre de documents qu’il récupère. Sinon, si vous devez indexer plus que 1 000 000 des documents, vous pouvez créer un Service client et assistance ticket à https://support.servicenow.com/now pour demander une augmentation de limite pour le connecteur.

    Procédure

    1. Accédez à la Tous > Connecteurs de contenu externe > Accueil de l'administrateur de contenu externe.
    2. Dans la liste Connecteurs, sélectionnez l’enregistrement du connecteur de contenu externe dont vous souhaitez modifier les Amazon S3 paramètres.
    3. Dans l’onglet Paramètres de de l’éditeur de connecteur, sélectionnez Paramètres d’analyse.
    4. Pour spécifier l’ensemble de compartiments analysés lorsque vous exécutez des analyses de contenu, sélectionnez l’une des options de filtrage de contenu suivantes :
      • Pour analyser toutes les catégories du système source, sélectionnez Analyser tout le contenu.
      • Pour analyser uniquement un ensemble spécifié de compartiments à partir du système source, sélectionnez Inclure uniquement ces compartiments, puis utilisez le champ Ajouter des URL de compartiment S3 à inclure et le bouton Ajouter pour saisir des URL pour les compartiments que vous souhaitez que le connecteur inclue lors de l’analyse.

        Par exemple, vous pouvez entrer https://s3.amazonaws.com/published pour inclure uniquement le contenu pouvant faire l’objet de recherches à partir d’une catégorie dont le nom est publié.

      • Pour analyser toutes les catégories à partir du système source, à l’exception d’un ensemble spécifié, sélectionnez Exclure uniquement ces boîtes utilisateur, puis utilisez le champ Ajouter des URL de catégorie S3 à exclure et le bouton Ajouter pour saisir des URL pour les catégories que vous souhaitez que le connecteur exclue lors de l’analyse.

        Par exemple, vous pouvez entrer des https://s3.amazonaws.com/legacy_bucket pour exclure le contenu pouvant faire l’objet d’une recherche d’une catégorie avec le nom legacy_bucket.

    Résultats

    Le Amazon S3 connecteur de contenu externe est mis à jour avec vos paramètres d’analyse modifiés.

    Que faire ensuite

    Pour récupérer du contenu à partir de votre Amazon S3 système source à l’aide de vos paramètres d’analyse modifiés, créez et exécutez une analyse de contenu unique pour votre Amazon S3 connecteur de contenu externe. Pour en savoir plus sur la création et l’exécution d’analyses de contenu ponctuelles, reportez-vous à la section Créer une analyse de contenu pour un connecteur de contenu externe.