Zing índice e atributos de dicionário de pesquisa

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 6 min. de leitura
  • Os atributos de dicionário a seguir afetam a maneira como o Zing indexa tabelas ou classifica os resultados da pesquisa.

    Atributos de dicionário de indexação e pesquisa

    O Zing usa atributos de dicionário definidos no nível de tabela ou campo para definir as seguintes configurações:
    • comportamento de indexação
    • classificação dos resultados da pesquisa
    • O algoritmo de classificação de relevância do BM25
    Tabela 1. Zing índice e atributos de dicionário de pesquisa
    Nome Tipo de Dados Aplica-se a Aplica-se a V3 ou V4 Descrição Rótulo Precisa de reindexação? Somente tabela raiz
    attachment_index booliano Tabela Ambos Se verdadeiro, os anexos na tabela serão indexados para fins de pesquisa. Índice de anexo VERDADEIRO FALSO
    no_text_index booliano Ambos Ambos Este atributo em um campo impede que o campo seja incluído em um índice de texto. Nenhum índice de texto VERDADEIRO FALSO
    text_index _attachment_body _weight float Tabela V4 Especifica quanta consideração (peso, um valor flutuante) deve ser dada a um termo de pesquisa encontrado no corpo de um anexo. Para obter mais informações sobre como o valor de ponderação afeta a relevância do resultado da pesquisa, consulte Zing calcula pontuações de documentos usando três componentes. Peso do corpo do anexo do índice de texto FALSO VERDADEIRO
    text_index _attachment_displayed booliano Tabela Ambos Exibe anexos nos resultados da pesquisa de texto. Anexo de índice de texto exibido FALSO FALSO
    text_index_attachment _title_weight float Tabela V4 Especifica quanta consideração (peso, um valor flutuante) deve ser dada a um termo de pesquisa encontrado no título de um anexo. Para obter mais informações sobre como o valor de ponderação afeta a relevância do resultado da pesquisa, consulte Zing calcula pontuações de documentos usando três componentes. Peso do título do anexo do índice de texto FALSO VERDADEIRO
    text_index _auto_stop booliano Tabela Ambos Identifica automaticamente palavras irrelevantes e não as indexa. Com base no limite especificado em text_index_auto_stop_threshold. Parada automática do índice de texto VERDADEIRO VERDADEIRO
    text_index_auto _stop_threshold Número inteiro Tabela Ambos Limite (inteiro, número de ocorrências) para uma palavra se tornar uma palavra de parada automaticamente. Consulte text_index_auto_stop. Limite de parada automática do índice de texto VERDADEIRO VERDADEIRO
    text_index_default_partial_matching_rule Cadeia de caracteres Tabela Ambos Cadeia de caracteres para configuração de regra de correspondência parcial. A entrada deve ser baseada em Mude o modo de consulta de uma tabela indexada . Regra de correspondência parcial padrão do índice de texto FALSO VERDADEIRO
    text_index _default_query_mode Cadeia de caracteres Tabela Ambos Cadeia de caracteres para configuração do modo de consulta. A entrada deve ser baseada em Mude o modo de consulta de uma tabela indexada Modo de consulta padrão do índice de texto FALSO VERDADEIRO
    text_index _disable_synonym booliano Tabela Ambos VERDADEIRO desabilita a pesquisa em sinônimos, bem como o termo de pesquisa. Sinônimo de Desabilitar índice de texto FALSO VERDADEIRO
    text_index _enable_idf booliano Tabela V3 VERDADEIRO habilita TF-IDF pontuação. IDF de habilitação do índice de texto FALSO VERDADEIRO
    text_index _filter_junk booliano Tabela Ambos VERDADEIRO Por padrão, FALSO desabilita o filtro de lixo eletrônico de uma tabela. Por padrão, o Zing não indexa ou pesquisa números de 2 dígitos e palavras de caractere único (a menos que sejam caracteres chineses ou japoneses). Gere novamente o índice depois de desabilitar o filtro de lixo eletrônico. Este atributo resulta em um índice de tabela maior. Para obter o desempenho ideal, não aplique-o a menos que seja necessário. Filtro de índice de texto - lixo eletrônico VERDADEIRO VERDADEIRO
    text_index _filter_query Uma encodedQuery na tabela Tabela Ambos Use este atributo quando quiser indexar as linhas que correspondem a condições de filtro específicas. O valor do atributo deve ser um encodedQuery na tabela. Filtro de índice VERDADEIRO FALSO
    text_index_filterable booliano Coluna Ambos Se um campo com este atributo definido como verdadeiro for alterado, a linha será avaliada para reindexação (mesmo que o próprio campo não seja indexável). Índice filtrável VERDADEIRO FALSO
    text_index_include _stop_word booliano Tabela Ambos se você precisar indexar palavras irrelevantes nesta tabela, defina este atributo como verdadeiro. Incluir palavra de parada do índice de texto VERDADEIRO VERDADEIRO
    texto_index_scorer_bm25_b float Tabela V4 Este atributo é o parâmetro b usado no algoritmo BM25. Consulte texto_index_scorer_bm25_b . bm25_b FALSO VERDADEIRO
    texto_index_scorer_bm25_k1 float Tabela V4 Este atributo é o parâmetro k1 usado no algoritmo BM25. Consulte texto_index_scorer_bm25_k1 . bm25_k1 FALSO VERDADEIRO
    text_index_tags Cadeia de caracteres Tabela Ambos Deve ser definido como Cadeia de caracteres específica: Empty/everyone_only/all_shared, dependendo do tipo de marcadores que deseja ser indexado. Marcadores de índice de texto VERDADEIRO FALSO
    text_index_tokenizer _language Cadeia de caracteres Tabela Ambos Coloque "ja" (sem aspas duplas) quando houver necessidade de apoiar a tokenização em japonês. Idioma do tokenizador de índice de texto VERDADEIRO VERDADEIRO
    text_index_translations booliano Tabela Ambos Se presente ou verdadeiro, força os índices a serem recalculados quando as cadeias de caracteres traduzidas são adicionadas. Requer a função de administrador do sistema para modificar. Definido automaticamente para campos indexados que são traduzidos e para campos que têm uma tradução e estão sendo indexados. A propriedade do sistema glide.i18n.force_index, cujo padrão é verdadeiro, substitui este atributo. Traduções de índice de texto VERDADEIRO FALSO
    text_search_and_or_limit Número inteiro Tabela Ambos Adicione o atributo personalizado no nível da tabela text_search_and_or_limit que substitui a propriedade global. Pesquisa de texto e ou limite FALSO FALSO
    ts_language Cadeia de caracteres Coluna Ambos Adicionado para permitir a indexação de texto somente de idiomas específicos. Idioma de pesquisa de texto VERDADEIRO FALSO
    ts_multi_value_field_splitter Cadeia de caracteres Coluna Ambos Se um campo for um campo de vários valores, adicione o divisor no campo neste atributo para distribuir as posições de índice dos valores. Por exemplo, para separar multi:value, coloque : para este atributo. Divisor de campo de vários valores da pesquisa de texto VERDADEIRO VERDADEIRO
    ts_weight Número inteiro Coluna Ambos Controla a importância relativa de uma correspondência no campo para pesquisa de texto. Para obter mais informações sobre como o valor de ponderação afeta a relevância do resultado da pesquisa, consulte Zing calcula pontuações de documentos usando três componentes. Para saber como definir o peso da pesquisa de texto para um campo, consulte Defina o peso relativo de um campo. Peso da pesquisa de texto FALSO FALSO

    no_text_index

    Para Suporte e atendimento ao cliente diretrizes sobre como definir o. no_text_index para diferentes tipos de campo, consulte KB0859922 em Now Support site.

    texto_index_scorer_bm25_b

    Este atributo de dicionário faz parte do algoritmo BM25. O atributo afeta a importância do tamanho de um documento nos resultados da pesquisa. Se este atributo for 0, o comprimento não terá rolamento. Neste caso, um documento de duas palavras seria avaliado igualmente como um documento com 1000 palavras. Documentos muito curtos geralmente são ponderados mais baixos do que documentos mais longos. O padrão é 0,75.

    texto_index_scorer_bm25_k1

    Este atributo de dicionário faz parte do algoritmo BM25. O atributo ajuda a determinar as características de saturação de frequência do termo, ou seja, fazer com que o termo de pesquisa apareça em um documento aumenta a relevância do documento, mas o aumento é menos impactante conforme os números sobem. Por exemplo, um termo de pesquisa que ocorre 10 vezes em um documento o torna mais relevante do que um documento que tem apenas uma ocorrência. No entanto, um documento que tem 100 ocorrências do termo de pesquisa pode não ser dez vezes mais impactante do que um documento que tem 10 ocorrências. A relevância se aproxima de uma assíntota máxima de efeito. Quanto maior o valor do atributo, menor será o efeito máximo de várias ocorrências. Os valores típicos estão entre 1,25 e 2,0.