Suporte à internacionalização para Pesquisa com IA

  • Versão de lançamento: Yokohama
  • Atualizado 4 de fev. de 2025
  • 6 min. de leitura
  • Pesquisa com IAsuporta indexação e pesquisa em todos os idiomas oferecidos pelo Now Platform®. Os recursos linguísticos de pesquisa são compatíveis com português brasileiro, holandês, inglês, francês, francês canadense, alemão, italiano, japonês, coreano, português, chinês simplificado, espanhol, sueco e chinês tradicional.

    O suporte à internacionalização é habilitado automaticamente e não é configurável.

    Para exibir a lista completa de idiomas oferecidos como Now Platformplug-ins e compatíveis em Pesquisa com IA, consulte Ative um idioma.
    Nota:
    Depois de ativar um novo plug-in de idioma, você deve reindexar todo o conteúdo de origem indexado que deseja tornar pesquisável no novo idioma. Para obter detalhes sobre reindexação, consulte Execute um índice de tabela completo ou reindexar para uma única origem indexada.
    As configurações de idioma determinam como Pesquisa com IAsepara o texto do conteúdo indexado e as consultas de pesquisa em termos individuais. Este processo, chamado tokenização , é tratado de forma diferente para cada idioma compatível, usando configurações específicas do idioma. Por exemplo, a maioria dos idiomas usa espaços e pontuação para separar palavras e frases, mas ao tokenizar texto chinês ou japonês, Pesquisa com IAem vez disso, usa a interpretação contextual para identificar corretamente quebras de palavras e frases. Ao tokenizar texto em japonês, Pesquisa com IAalém disso, reconhece o nakaguro (ponto do meio) como um separador de palavras.
    Nota:
    Se você indexou conteúdo em português brasileiro, holandês, italiano, japonês, coreano, português ou suecoAntes de agosto de 2024, você deve reindexá-lo para se beneficiar de novas melhorias de tokenização para esses idiomas.

    Comportamento de indexação em idiomas compatíveis

    Ao indexar conteúdo e metadados de um Now Platformregistro de origem ou um documento externo, Pesquisa com IAusa configurações de tokenização para o idioma do registro ou documento, conforme mostrado na tabela a seguir.

    Registro ou documento Configurações de tokenização
    Registro de origem da tabela Tarefa [tarefa] ou de uma de suas tabelas secundárias Pesquisa com IA executa a identificação de idioma e usa configurações de tokenização para o idioma detectado para indexar o conteúdo e os metadados do registro.
    Nota:
    A identificação de idioma identifica somente português brasileiro, holandês, inglês, francês, francês canadense, alemão, italiano, japonês, coreano, português, chinês simplificado, espanhol, sueco e chinês tradicional. O conteúdo em outros idiomas é identificado e tratado como inglês.
    Registro de origem de uma tabela não Tarefa

    Pesquisa com IA usa configurações de tokenização para o idioma do registro para indexar seu conteúdo e metadados.

    Se o registro não tiver nenhum idioma especificado, o. Now Platformo trata como estando no idioma padrão da instância. Em uma instância em inglês, por exemplo, Pesquisa com IAIndexa registros sem idiomas especificados usando configurações de tokenização para inglês.

    Documento externo Pesquisa com IA executa a identificação de idioma e usa configurações de tokenização para o idioma detectado para indexar o conteúdo e os metadados do documento.
    Nota:
    A identificação de idioma identifica somente português brasileiro, holandês, inglês, francês, francês canadense, alemão, italiano, japonês, coreano, português, chinês simplificado, espanhol, sueco e chinês tradicional. O conteúdo em outros idiomas é identificado e tratado como inglês.
    Nota:
    Ao indexar conteúdo e metadados, Pesquisa com IAreconhece regiões de Japonês, chinês simplificado e chinês tradicionaltexto incorporado ao texto em outros idiomas. Essas regiões de texto são indexadas com as configurações de tokenização de idioma apropriadas, independentemente do idioma do texto ao redor. Por exemplo, suponha que você indexe um artigo de conhecimento em inglês que inclua um parágrafo de chinês simplificado. Pesquisa com IAIndexa o conteúdo deste parágrafo como chinês simplificado e o restante do conteúdo do registro como inglês.

    Comportamento da consulta de pesquisa em idiomas compatíveis

    Ao processar o texto da consulta de pesquisa, Pesquisa com IAusa configurações de tokenização para o idioma do usuário atual Now Platformsessão.
    Nota:
    Pesquisa com IAreconhece Japonês, chinês simplificado e chinês tradicionaltermos nas consultas de pesquisa. Esses termos são processados com as configurações de tokenização de idioma apropriadas, independentemente do idioma da sessão do usuário. Por exemplo, se um usuário em uma sessão de usuário francês pesquisar por replacement ordenateur 笔记本电脑 , Pesquisa com IAAplica configurações de chinês simplificado para 笔记本电脑 Configurações de termo e francês para os outros termos de pesquisa.

    Pesquisa com IA compara os termos da consulta de pesquisa com termos do conteúdo indexado e metadados, retornando resultados de pesquisa para registros indexados ou documentos que contêm correspondências. Quando os termos de pesquisa estiverem no mesmo idioma que os termos indexados, Pesquisa com IAprocessa ambos os conjuntos de termos com as mesmas configurações de tokenização, produzindo correspondências previsíveis e resultados de pesquisa. Se os termos de pesquisa não estiverem no mesmo idioma que os termos indexados, Pesquisa com IAprocessa os dois conjuntos de termos com diferentes configurações de tokenização e a correspondência pode ser imprevisível.

    Dependência de idioma para recursos de pesquisa

    Os seguintes recursos de pesquisa dependem do idioma e são compatíveis somente com os idiomas listados.

    Tabela 1. Dependência de idioma do recurso de pesquisa
    Recurso Idiomas compatíveis e dependência de idioma
    Resultados do Genius

    Pesquisa com IAAvalia somente as configurações de resultado Genius com NLUaciona se o vinculado NLUo modelo tem o mesmo idioma da consulta de pesquisa.

    Idiomas compatíveis: Inglês.

    Identificação de idioma e tokenização

    Durante a indexação, Pesquisa com IAIdentifica os idiomas compatíveis nos registros da tabela de tarefas e documentos externos. O processamento de texto para o conteúdo indexado usa configurações de tokenização para o idioma identificado.

    Idiomas compatíveis: português brasileiro, holandês, inglês, francês, francês canadense, alemão, italiano, japonês, coreano, português, chinês simplificado, espanhol, sueco e chinês tradicional.

    Lema e normalização Unicode

    Pesquisa com IA executa a normalização de lema específica do idioma para termos no conteúdo indexado e nas consultas de pesquisa.

    Idiomas compatíveis: português brasileiro, holandês, inglês, francês, francês canadense, alemão, italiano, japonês, coreano, português, chinês simplificado, espanhol, sueco e chinês tradicional.
    Nota:
    Para Alemão, coreano e sueco, Pesquisa com IAexecuta a descompactação de termo, além da normalização do lema.

    Pesquisa com IA Executa a normalização Unicode para todos os termos no conteúdo indexado e nas consultas de pesquisa.

    Para obter mais informações sobre normalização de lemas e formulários Unicode em conteúdo indexado e consultas de pesquisa, consulte Lema e normalização Unicode.

    Regras de melhoria de resultados

    Pesquisa com IAavalia a ativação somente para regras de melhoria de resultados que tenham o mesmo idioma da consulta de pesquisa ou que tenham Todos os idiomas especificado.

    Idiomas compatíveis: Todos os idiomas ativados em sua instância. Para obter a lista de idiomas que você pode ativar, consulte Ative um idioma.

    Palavras irrelevantes

    Pesquisa com IA considera somente palavras de parada de dicionários que tenham o mesmo idioma da consulta de pesquisa.

    Idiomas compatíveis: Todos os idiomas ativados em sua instância. Para obter a lista de idiomas que você pode ativar, consulte Ative um idioma.

    Sinônimos

    Pesquisa com IA considera somente sinônimos de dicionários que têm o mesmo idioma da consulta de pesquisa.

    Idiomas compatíveis: Todos os idiomas ativados em sua instância. Para obter a lista de idiomas que você pode ativar, consulte Ative um idioma.

    Tratamento de erros de digitação

    Pesquisa com IA deriva uma lista separada de termos de correção automática para cada idioma compatível encontrado no conteúdo indexado da fonte de pesquisa. A correção automática substitui somente termos de consulta de pesquisa por termos da lista que tenham o mesmo idioma da consulta de pesquisa.

    Idiomas compatíveis: Português brasileiro, holandês, inglês, francês canadense, francês, alemão, italiano, português, espanhol e sueco. A manipulação de erros de digitação não é compatível com Japonês, coreano, chinês simplificado ou chinês tradicional.