Definir configurações de rastreamento para um GitLab conector de conteúdo externo

  • Versão de lançamento: Zurich
  • Atualizado 30 de jul. de 2025
  • 6 min. de leitura
  • Especifique os grupos, projetos e repositórios que você deseja GitLab conector de conteúdo externo a ser rastreado. Selecione os problemas, wikis, solicitações de mesclagem, marcadores, ramificações, e confirma para as quais você deseja que o rastreamento recupere e alimente Pesquisa com IA para indexação.

    Antes de Iniciar

    Um administrador já deve ter criado o. GitLab conector de conteúdo externo para o qual você deseja definir as configurações de rastreamento. Para saber mais sobre este procedimento, consulte Crie um GitLab conector de conteúdo externo.

    Função necessária: ais_admin

    Por Que e Quando Desempenhar Esta Tarefa

    Esta tarefa é opcional. Por padrão, o GitLab o conector de conteúdo externo rastreia o conteúdo de todos os subgrupos, projetos e repositórios encontrados em grupos de nível superior pertencentes ao GitLab usuário .com que ele está configurado para representar e envia todos os tipos de conteúdo compatíveis (problemas, wikis, solicitações de mesclagem, marcadores, ramificações, e confirma) para Pesquisa com IA para indexação. Você só precisa executar esta tarefa se quiser que o conector use qualquer uma das seguintes configurações não padrão:
    • Filtros de inclusão ou exclusão para os subgrupos considerar ao executar rastreamentos de conteúdo
    • Filtros de inclusão ou exclusão a serem considerados pelos projetos/repositórios ao executar rastreamentos de conteúdo
    • Filtros de inclusão ou exclusão para os tipos de conteúdo a serem recuperados do sistema de origem ao executar rastreamentos de conteúdo
    • Filtros de inclusão ou exclusão para que as ramificações recuperem do sistema de origem ao executar rastreamentos de conteúdo
    Importante:

    Por padrão, um conector de conteúdo externo pode indexar até um milhão ( 1,000,000 ) de seu sistema de origem. Quando um conector excede esse limite, ele continua a rastrear o sistema de origem, mas envia somente exclusões e atualizações de documentos para Pesquisa com IA para indexação, ignorando novos documentos. O conector registra em log uma mensagem de erro para cada 10 000 documentos rastreados além do limite de indexação.

    Quando a contagem de documentos indexados de um conector excede 800 000 , Uma mensagem de aviso aparece na IU do conector para indicar que ele está se aproximando do limite de indexação. Se o conector atingir o limite de indexação, uma mensagem de erro será exibida em sua IU.

    Se um dos seus conectores atingir o limite de indexação, você poderá atualizar as configurações de rastreamento e os filtros de inclusão/exclusão de arquivo para reduzir o número de documentos recuperados. Como alternativa, se você precisar indexar mais de 1,000,000 , você pode criar um Suporte e atendimento ao cliente caso em https://support.servicenow.com/nowpara solicitar um aumento de limite para o conector.

    Procedimento

    1. Navegar até Tudo > Conectores de conteúdo externo > Página inicial do administrador de conteúdo externo.
    2. Na lista Conectores, selecione o registro para GitLab conector de conteúdo externo cujas configurações você deseja modificar.
    3. No editor do conector Configurações , selecione Configurações de rastreamento .
    4. Para especificar o conjunto de subgrupos rastreados quando você executa rastreamentos de conteúdo, selecione uma das seguintes opções Filtragem de grupo opções:
      • Para rastrear todos os subgrupos encontrados em grupos de nível superior pertencentes à representação do conector GitLab conta de usuário .com, selecione Rastrear todos os grupos .
      • Para rastrear somente um conjunto especificado de subgrupos encontrados em grupos de nível superior pertencentes à representação do conector GitLab conta de usuário .com, selecione Incluir somente esses grupos , em seguida, use Adicione URLs de grupo a serem incluídos e. Adicionar Botão para inserir URLs para os grupos que você deseja incluir no rastreamento.
        Nota:
        URLs de inclusão de subgrupo podem ser especificados como prefixos, com o caractere curinga * No final do URL correspondente a qualquer cadeia de caracteres.

        Por exemplo, você pode inserir https://gitlab.com/example-dot-com/production para incluir somente conteúdo pesquisável do produção e todos os subgrupos que ele contém.

      • Para rastrear todos, exceto um conjunto especificado de grupos encontrados em grupos de nível superior pertencentes à representação do conector GitLab conta de usuário .com, selecione Exclua somente esses grupos , em seguida, use Adicione URLs de grupo a serem excluídos e. Adicionar Botão para inserir URLs para os grupos que você deseja excluir do rastreamento.
        Nota:
        URLs de exclusão de subgrupo podem ser especificados como prefixos, com o caractere curinga * No final do URL correspondente a qualquer cadeia de caracteres.

        Por exemplo, você pode inserir https://gitlab.com/example-dot-com/test-* para excluir conteúdo pesquisável de todos os subgrupos com nomes que começam com teste- .

    5. Para especificar o conjunto de projetos e repositórios rastreados quando você executa rastreamentos de conteúdo, selecione uma das seguintes opções Filtragem de projeto/repositório opções:
      • Para rastrear todos os projetos e repositórios pertencentes à representação do conector GitLab conta de usuário .com, selecione Rastrear todos os projetos/repositórios .
      • Para rastrear somente um conjunto especificado de projetos e repositórios pertencentes à representação do conector GitLab conta de usuário .com, selecione Incluir somente estes projetos/repositórios , em seguida, use Adicione URLs de projeto/repositório a serem incluídos e. Adicionar Botão para inserir URLs para os projetos e repositórios que você deseja incluir no rastreamento.
        Nota:
        As URLs de inclusão do projeto e repositório podem ser especificadas como prefixos, com o caractere curinga * No final do URL correspondente a qualquer cadeia de caracteres.

        Por exemplo, você pode inserir https://gitlab.com/example-dot-com/prod-* para incluir somente conteúdo pesquisável de projetos cujos nomes começam com prod- .

      • Para rastrear todos, exceto um conjunto especificado de projetos e repositórios pertencentes à representação do conector GitLab conta de usuário .com, selecione Exclua somente esses projetos/repositórios , em seguida, use Adicione URLs de projeto/repositório a serem excluídos e. Adicionar Botão para inserir URLs para os projetos e repositórios que você deseja excluir do rastreamento.
        Nota:
        URLs de exclusão do projeto e repositório podem ser especificados como prefixos, com o caractere curinga * No final do URL correspondente a qualquer cadeia de caracteres.

        Por exemplo, você pode inserir https://gitlab.com/example-dot-com/confidential273 para excluir conteúdo pesquisável do confidencial273 projeto.

    6. Habilite o. Rastrear tipos de conteúdo opções para os tipos de conteúdo que você deseja recuperar ao executar rastreamentos de conteúdo.
      . GitLab o conector de conteúdo externo oferece suporte à indexação de conteúdo pesquisável para estes tipos de conteúdo:
      Tipo de conteúdo Conteúdo pesquisável indexado
      Problemas Descrição do problema
      Wikis Conteúdo de Markdown convertido em HTML (sem anexos)
      Mesclar solicitações Descrição da solicitação de mesclagem (Markdown) e discussões
      Marcadores Marque a mensagem
      Filiais Mensagem de confirmação da confirmação HEAD
      Confirmar Mensagem de confirmação
      Importante:
      . GitLab o conector de conteúdo externo não oferece suporte à indexação de conteúdo pesquisável de nenhum destes tipos de conteúdo:
      • Discussões de confirmação, problema e wiki
      • Confirmar diferenças
      • Conteúdo de grupos ou projetos arquivados
      • Conteúdo de grupos ou projetos no estado de exclusão pendente
      • Conteúdo de subgrupos de grupos de nível superior que não pertencem ao representado GitLab usuário .com
      • Conteúdo de arquivos anexados a problemas ou solicitações de mesclagem
      • Conteúdo de anexos wiki em formatos diferentes de texto simples (.txt)
      • Anotações internas ou confidenciais em discussões de solicitação de mesclagem
      • Arquivos do repositório
    7. Se você incluiu o tipo de conteúdo Ramificações na etapa 6, use Adicione ramificações a serem incluídas no formato regex e Adicionar Botão para especificar padrões de expressão regular Java que correspondam aos nomes das ramificações que você deseja incluir nos rastreamentos de conteúdo.
      Como exemplo, você pode especificar USD 2025.* USD para incluir ramificações com nomes que começam com 2025 ou especifique .* USD para rastrear todas as ramificações. Para saber mais sobre a sintaxe do padrão de expressão regular Java, consulte O Javadoc da classe java.regex.util.pattern .
      Nota:
      As expressões do nome da ramificação ^main$e. ^master$são incluídos por padrão. Você não pode remover essas ramificações da lista.

    Resultado

    . GitLab o conector de conteúdo externo foi atualizado com suas configurações de rastreamento modificadas.

    O que Fazer Depois

    Para recuperar conteúdo do seu GitLab usando suas configurações de rastreamento modificadas, crie e execute um rastreamento de conteúdo único para seu GitLab conector de conteúdo externo. Para saber mais sobre como criar e executar rastreamentos únicos de conteúdo, consulte Crie um rastreamento de conteúdo para um conector de conteúdo externo.