Definir configurações de rastreamento para um Amazon S3 conector de conteúdo externo
Defina filtros de inclusão e exclusão para especificar os buckets e os tipos de arquivo que você deseja Amazon S3 conector de conteúdo externo a ser recuperado ao executar rastreamentos de conteúdo.
Antes de Iniciar
Um administrador já deve ter criado o. Amazon S3 conector de conteúdo externo para o qual você deseja definir as configurações de rastreamento. Para saber mais sobre este procedimento, consulte Crie um Amazon S3 conector de conteúdo externo.
Função necessária: ais_admin
Por Que e Quando Desempenhar Esta Tarefa
- Filtros de inclusão ou exclusão para os buckets considerar ao executar rastreamentos de conteúdo
- Filtros de inclusão ou exclusão para que as extensões de arquivo sejam recuperadas ao executar rastreamentos de conteúdo
Por padrão, um conector de conteúdo externo pode indexar até um milhão ( 1,000,000 ) de seu sistema de origem. Quando um conector excede esse limite, ele continua a rastrear o sistema de origem, mas envia somente exclusões e atualizações de documentos para Pesquisa com IA para indexação, ignorando novos documentos. O conector registra em log uma mensagem de erro para cada 10 000 documentos rastreados além do limite de indexação.
Quando a contagem de documentos indexados de um conector excede 800 000 , Uma mensagem de aviso aparece na IU do conector para indicar que ele está se aproximando do limite de indexação. Se o conector atingir o limite de indexação, uma mensagem de erro será exibida em sua IU.
Se um dos seus conectores atingir o limite de indexação, você poderá atualizar as configurações de rastreamento e os filtros de inclusão/exclusão de arquivo para reduzir o número de documentos recuperados. Como alternativa, se você precisar indexar mais de 1,000,000 , você pode criar um Suporte e atendimento ao cliente caso em https://support.servicenow.com/nowpara solicitar um aumento de limite para o conector.
Procedimento
- Na lista Conectores, selecione o registro para Amazon S3 conector de conteúdo externo cujas configurações você deseja modificar.
- No editor do conector Configurações , selecione Configurações de rastreamento .
-
Para especificar o conjunto de buckets rastreados quando você executa rastreamentos de conteúdo, selecione uma das seguintes opções Filtragem de conteúdo opções:
- Para rastrear todos os buckets do sistema de origem, selecione Rastrear todo o conteúdo .
-
Para rastrear somente um conjunto especificado de buckets do sistema de origem, selecione Inclua somente esses buckets , em seguida, use Adicione URLs de bucket do S3 a serem incluídos e. Adicionar Botão para inserir URLs para buckets que você deseja que o conector inclua ao rastrear.
Como exemplo, você pode inserir https://s3.amazonaws.com/published para incluir somente conteúdo pesquisável de um bucket com nome publicado .
-
Para rastrear todos, exceto um conjunto especificado de buckets do sistema de origem, selecione Exclua somente essas caixas de usuário , em seguida, use Adicione URLs de bucket do S3 a serem excluídos e. Adicionar Botão para inserir URLs para buckets que você deseja que o conector exclua ao rastrear.
Como exemplo, você pode inserir https://s3.amazonaws.com/legacy_bucket para excluir conteúdo pesquisável de um bucket com nome legacy_bucket .
Resultado
. Amazon S3 o conector de conteúdo externo foi atualizado com suas configurações de rastreamento modificadas.
O que Fazer Depois
Para recuperar conteúdo do seu Amazon S3 usando suas configurações de rastreamento modificadas, crie e execute um rastreamento de conteúdo único para seu Amazon S3 conector de conteúdo externo. Para saber mais sobre como criar e executar rastreamentos únicos de conteúdo, consulte Crie um rastreamento de conteúdo para um conector de conteúdo externo.