Configurer les paramètres d’analyse pour un connecteur de GitLab contenu externe

  • Rversion finale: Zurich
  • Mis à jour 30 juil. 2025
  • 7 minutes de lecture
  • Spécifiez les groupes, les projets et les référentiels que vous souhaitez que votre GitLab connecteur de contenu externe analyse. Sélectionnez les problèmes, les wikis, les demandes de fusion, les balises, les branches et les validations que vous souhaitez que l’exploration récupère et alimente pour l’indexation Recherche IA .

    Avant de commencer

    Un administrateur doit déjà avoir créé le connecteur de contenu externe pour lequel vous souhaitez configurer les GitLab paramètres d’analyse. Pour en savoir plus sur cette procédure, reportez-vous à la section Créer un connecteur de GitLab contenu externe.

    Rôle requis : ais_admin

    Pourquoi et quand exécuter cette tâche

    Cette tâche est facultative. Par défaut, le GitLab connecteur de contenu externe analyse le contenu de tous les sous-groupes, projets et référentiels trouvés dans les groupes de niveau supérieur appartenant à l’utilisateur .com dont il est configuré pour emprunter l’identité GitLab, et envoie tous les types de contenu pris en charge (problèmes, wikis, demandes de fusion, balises, branches et validations) à l’indexation Recherche IA . Vous ne devez effectuer cette tâche que si vous souhaitez que le connecteur utilise l’un des paramètres autres que par défaut suivants :
    • Filtres d’inclusion ou d’exclusion pour les sous-groupes à prendre en compte lors de l’exécution d’analyses de contenu
    • Filtres d’inclusion ou d’exclusion pour les projets/référentiels à prendre en compte lors de l’exécution d’analyses de contenu
    • Filtres d’inclusion ou d’exclusion pour les types de contenu à récupérer à partir du système source lors de l’exécution d’analyses de contenu
    • Filtres d’inclusion ou d’exclusion pour les branches à récupérer à partir du système source lors de l’exécution d’analyses de contenu
    Important :

    Par défaut, un connecteur de contenu externe peut indexer jusqu’aux un million (1 000 000) documents de son système source. Lorsqu’un connecteur dépasse cette limite, il continue d’analyser le système source, mais envoie uniquement des suppressions et des mises à jour de documents à des fins d’indexation Recherche IA , ignorant les nouveaux documents. Le connecteur enregistre un message d’erreur pour chaque tranche de 10 000 documents qu’il analyse au-delà de la limite d’indexation.

    Lorsque le nombre de documents indexés d’un connecteur dépasse 800 000, un message d’avertissement s’affiche dans l’interface utilisateur du connecteur pour indiquer qu’il approche de la limite d’indexation. Si le connecteur atteint la limite d’indexation, un message d’erreur s’affiche dans son interface utilisateur.

    Si l’un de vos connecteurs atteint la limite d’indexation, vous pouvez mettre à jour ses paramètres d’analyse et ses filtres d’inclusion/exclusion de fichiers pour réduire le nombre de documents qu’il récupère. Sinon, si vous devez indexer plus que 1 000 000 des documents, vous pouvez créer un Service client et assistance ticket à https://support.servicenow.com/now pour demander une augmentation de limite pour le connecteur.

    Procédure

    1. Accédez à la Tous > Connecteurs de contenu externe > Accueil de l'administrateur de contenu externe.
    2. Dans la liste Connecteurs, sélectionnez l’enregistrement du connecteur de contenu externe dont vous souhaitez modifier les GitLab paramètres.
    3. Dans l’onglet Paramètres de de l’éditeur de connecteur, sélectionnez Paramètres d’analyse.
    4. Pour spécifier l’ensemble des sous-groupes analysés lorsque vous exécutez des analyses de contenu, sélectionnez l’une des options de filtrage de groupe suivantes :
      • Pour analyser tous les sous-groupes trouvés dans les groupes de niveau supérieur appartenant au compte d’utilisateur .com dont l’identité a été empruntée GitLab par le connecteur, sélectionnez Analyser tous les groupes.
      • Pour analyser uniquement un ensemble spécifié de sous-groupes trouvés dans les groupes de niveau supérieur appartenant au compte d’utilisateur de .com dont l’identité a été empruntée GitLab par le connecteur, sélectionnez Inclure uniquement ces groupes, puis utilisez le champ Ajouter des URL de groupe à inclure et le bouton Ajouter pour saisir des URL pour les groupes que vous souhaitez inclure dans l’analyse.
        Remarque :
        Les URL d’inclusion de sous-groupes peuvent être spécifiées en tant que préfixes, avec le caractère générique * à la fin de l’URL correspondant à n’importe quelle chaîne.

        Par exemple, vous pouvez saisir https://gitlab.com/example-dot-com/production pour inclure uniquement le contenu pouvant faire l’objet de recherches à partir du sous-groupe de production et de tous les sous-groupes qu’il contient.

      • Pour analyser tous les groupes, à l’exception d’un ensemble spécifié, trouvés dans les groupes de niveau supérieur appartenant au compte d’utilisateur .com dont l’identité a été empruntée GitLab par le connecteur, sélectionnez Exclure uniquement ces groupes, puis utilisez le champ Ajouter des URL de groupe pour exclure et le bouton Ajouter pour saisir des URL pour les groupes que vous souhaitez exclure de l’analyse.
        Remarque :
        Les URL d’exclusion de sous-groupes peuvent être spécifiées en tant que préfixes, avec le caractère générique * à la fin de l’URL correspondant à n’importe quelle chaîne.

        Par exemple, vous pouvez entrer https://gitlab.com/example-dot-com/test-* pour exclure le contenu pouvant faire l’objet d’une recherche de tous les sous-groupes dont le nom commence par test-.

    5. Pour spécifier l’ensemble de projets et de référentiels analysés lorsque vous exécutez des analyses de contenu, sélectionnez l’une des options de filtrage de projet/référentiel suivantes :
      • Pour analyser tous les projets et référentiels appartenant au compte d’utilisateur de .com dont l’identité a été empruntée GitLab par le connecteur, sélectionnez Analyser tous les projets/référentiels.
      • Pour analyser uniquement un ensemble spécifié de projets et de référentiels appartenant au compte d’utilisateur de .com emprunté GitLab par le connecteur, sélectionnez Inclure uniquement ces projets/référentiels, puis utilisez le champ Ajouter des URL de projet/référentiel à inclure et le bouton Ajouter pour saisir les URL des projets et référentiels que vous souhaitez inclure dans l’analyse.
        Remarque :
        Les URL d’inclusion de projet et de référentiel peuvent être spécifiées sous forme de préfixes, le caractère générique * à la fin de l’URL correspondant à n’importe quelle chaîne.

        Par exemple, vous pouvez entrer https://gitlab.com/example-dot-com/prod-* pour inclure uniquement le contenu consultable des projets dont le nom commence par prod-.

      • Pour analyser tous ces projets/référentiels, à l’exception d’un ensemble spécifié de projets et de référentiels appartenant au compte d’utilisateur .com dont l’identité a été empruntée GitLab par le connecteur, sélectionnez Exclure uniquement ces projets/référentiels, puis utilisez le champ Ajouter des URL de projet/référentiel à exclure et le bouton Ajouter pour saisir les URL des projets et référentiels que vous souhaitez exclure de l’analyse.
        Remarque :
        Les URL d’exclusion de projets et de référentiels peuvent être spécifiées sous forme de préfixes, le caractère générique * à la fin de l’URL correspondant à n’importe quelle chaîne.

        Par exemple, vous pouvez entrer des https://gitlab.com/example-dot-com/confidential273 pour exclure le contenu consultable du projet confidential273 .

    6. Activez les options de types de contenu d’analyse pour les types de contenu que vous souhaitez récupérer lorsque vous exécutez des analyses de contenu.
      Le GitLab connecteur de contenu externe prend en charge l’indexation du contenu pouvant faire l’objet de recherches pour ces types de contenu :
      Type de contenu Contenu pouvant faire l’objet d’une recherche indexé
      Problèmes Description du problème
      Wiki Contenu Markdown converti en HTML (sans pièces jointes)
      Fusionner les demandes Description de la demande de fusion (MarkDown) et discussions
      Balises Message de balise
      Succursales Message de validation de la validation principale
      Validations Message d'engagement
      Important :
      Le GitLab connecteur de contenu externe ne prend pas en charge l’indexation du contenu pouvant faire l’objet de recherches à partir de l’un de ces types de contenu :
      • Validation, problème et discussions wiki
      • Différences de validation
      • Contenu de groupes ou de projets archivés
      • Contenu provenant de groupes ou de projets dont l’état est En attente de suppression
      • Contenu provenant de sous-groupes de groupes de niveau supérieur qui n’appartiennent pas à l’utilisateur dont l’identité a été empruntée GitLab.com
      • Contenu des fichiers joints aux problèmes ou aux demandes de fusion
      • Contenu des pièces jointes wiki dans des formats autres que le texte brut (.txt)
      • Notes internes ou confidentielles dans les discussions de demande de fusion
      • Fichiers du référentiel
    7. Si vous avez inclus le type de contenu Branches dans l’étape 6, utilisez le champ Ajouter des branches à inclure au format regex et le bouton Ajouter pour spécifier des schémas d’expression régulière Java correspondant aux noms des branches que vous souhaitez inclure dans les analyses de contenu.
      Par exemple, vous pouvez spécifier ^2025.*$ pour inclure les branches dont les noms commencent par 2025, ou spécifier ^.*$ pour analyser toutes les branches. Pour en savoir plus sur la syntaxe des modèles d’expression régulière Java, consultez la Javadoc pour la classe java.regex.util.Pattern.
      Remarque :
      Les expressions ^main$ de nom de branche et ^master$ sont incluses par défaut. Vous ne pouvez pas supprimer ces branches de la liste.

    Résultats

    Le GitLab connecteur de contenu externe est mis à jour avec vos paramètres d’analyse modifiés.

    Que faire ensuite

    Pour récupérer du contenu à partir de votre GitLab système source à l’aide de vos paramètres d’analyse modifiés, créez et exécutez une analyse de contenu unique pour votre GitLab connecteur de contenu externe. Pour en savoir plus sur la création et l’exécution d’analyses de contenu ponctuelles, reportez-vous à la section Créer une analyse de contenu pour un connecteur de contenu externe.