Zing índice e atributos de dicionário de pesquisa
Os atributos de dicionário a seguir afetam a maneira como o Zing indexa tabelas ou classifica os resultados da pesquisa.
Atributos de dicionário de indexação e pesquisa
- comportamento de indexação
- classificação dos resultados da pesquisa
- O algoritmo de classificação de relevância do BM25
| Nome | Tipo de Dados | Aplica-se a | Aplica-se a V3 ou V4 | Descrição | Rótulo | Precisa de reindexação? | Somente tabela raiz |
|---|---|---|---|---|---|---|---|
| attachment_index | booliano | Tabela | Ambos | Se verdadeiro, os anexos na tabela serão indexados para fins de pesquisa. | Índice de anexo | VERDADEIRO | FALSO |
| no_text_index | booliano | Ambos | Ambos | Este atributo em um campo impede que o campo seja incluído em um índice de texto. | Nenhum índice de texto | VERDADEIRO | FALSO |
| text_index _attachment_body _weight | float | Tabela | V4 | Especifica quanta consideração (peso, um valor flutuante) deve ser dada a um termo de pesquisa encontrado no corpo de um anexo. Para obter mais informações sobre como o valor de ponderação afeta a relevância do resultado da pesquisa, consulte Zing calcula pontuações de documentos usando três componentes. | Peso do corpo do anexo do índice de texto | FALSO | VERDADEIRO |
| text_index _attachment_displayed | booliano | Tabela | Ambos | Exibe anexos nos resultados da pesquisa de texto. | Anexo de índice de texto exibido | FALSO | FALSO |
| text_index_attachment _title_weight | float | Tabela | V4 | Especifica quanta consideração (peso, um valor flutuante) deve ser dada a um termo de pesquisa encontrado no título de um anexo. Para obter mais informações sobre como o valor de ponderação afeta a relevância do resultado da pesquisa, consulte Zing calcula pontuações de documentos usando três componentes. | Peso do título do anexo do índice de texto | FALSO | VERDADEIRO |
| text_index _auto_stop | booliano | Tabela | Ambos | Identifica automaticamente palavras irrelevantes e não as indexa. Com base no limite especificado em text_index_auto_stop_threshold. | Parada automática do índice de texto | VERDADEIRO | VERDADEIRO |
| text_index_auto _stop_threshold | Número inteiro | Tabela | Ambos | Limite (inteiro, número de ocorrências) para uma palavra se tornar uma palavra de parada automaticamente. Consulte text_index_auto_stop. | Limite de parada automática do índice de texto | VERDADEIRO | VERDADEIRO |
| text_index_default_partial_matching_rule | Cadeia de caracteres | Tabela | Ambos | Cadeia de caracteres para configuração de regra de correspondência parcial. A entrada deve ser baseada em Mude o modo de consulta de uma tabela indexada . | Regra de correspondência parcial padrão do índice de texto | FALSO | VERDADEIRO |
| text_index _default_query_mode | Cadeia de caracteres | Tabela | Ambos | Cadeia de caracteres para configuração do modo de consulta. A entrada deve ser baseada em Mude o modo de consulta de uma tabela indexada | Modo de consulta padrão do índice de texto | FALSO | VERDADEIRO |
| text_index _disable_synonym | booliano | Tabela | Ambos | VERDADEIRO desabilita a pesquisa em sinônimos, bem como o termo de pesquisa. | Sinônimo de Desabilitar índice de texto | FALSO | VERDADEIRO |
| text_index _enable_idf | booliano | Tabela | V3 | VERDADEIRO habilita TF-IDF pontuação. | IDF de habilitação do índice de texto | FALSO | VERDADEIRO |
| text_index _filter_junk | booliano | Tabela | Ambos | VERDADEIRO Por padrão, FALSO desabilita o filtro de lixo eletrônico de uma tabela. Por padrão, o Zing não indexa ou pesquisa números de 2 dígitos e palavras de caractere único (a menos que sejam caracteres chineses ou japoneses). Gere novamente o índice depois de desabilitar o filtro de lixo eletrônico. Este atributo resulta em um índice de tabela maior. Para obter o desempenho ideal, não aplique-o a menos que seja necessário. | Filtro de índice de texto - lixo eletrônico | VERDADEIRO | VERDADEIRO |
| text_index _filter_query | Uma encodedQuery na tabela | Tabela | Ambos | Use este atributo quando quiser indexar as linhas que correspondem a condições de filtro específicas. O valor do atributo deve ser um encodedQuery na tabela. | Filtro de índice | VERDADEIRO | FALSO |
| text_index_filterable | booliano | Coluna | Ambos | Se um campo com este atributo definido como verdadeiro for alterado, a linha será avaliada para reindexação (mesmo que o próprio campo não seja indexável). | Índice filtrável | VERDADEIRO | FALSO |
| text_index_include _stop_word | booliano | Tabela | Ambos | se você precisar indexar palavras irrelevantes nesta tabela, defina este atributo como verdadeiro. | Incluir palavra de parada do índice de texto | VERDADEIRO | VERDADEIRO |
| texto_index_scorer_bm25_b | float | Tabela | V4 | Este atributo é o parâmetro b usado no algoritmo BM25. Consulte texto_index_scorer_bm25_b . | bm25_b | FALSO | VERDADEIRO |
| texto_index_scorer_bm25_k1 | float | Tabela | V4 | Este atributo é o parâmetro k1 usado no algoritmo BM25. Consulte texto_index_scorer_bm25_k1 . | bm25_k1 | FALSO | VERDADEIRO |
| text_index_tags | Cadeia de caracteres | Tabela | Ambos | Deve ser definido como Cadeia de caracteres específica: Empty/everyone_only/all_shared, dependendo do tipo de marcadores que deseja ser indexado. | Marcadores de índice de texto | VERDADEIRO | FALSO |
| text_index_tokenizer _language | Cadeia de caracteres | Tabela | Ambos | Coloque "ja" (sem aspas duplas) quando houver necessidade de apoiar a tokenização em japonês. | Idioma do tokenizador de índice de texto | VERDADEIRO | VERDADEIRO |
| text_index_translations | booliano | Tabela | Ambos | Se presente ou verdadeiro, força os índices a serem recalculados quando as cadeias de caracteres traduzidas são adicionadas. Requer a função de administrador do sistema para modificar. Definido automaticamente para campos indexados que são traduzidos e para campos que têm uma tradução e estão sendo indexados. A propriedade do sistema glide.i18n.force_index, cujo padrão é verdadeiro, substitui este atributo. | Traduções de índice de texto | VERDADEIRO | FALSO |
| text_search_and_or_limit | Número inteiro | Tabela | Ambos | Adicione o atributo personalizado no nível da tabela text_search_and_or_limit que substitui a propriedade global. | Pesquisa de texto e ou limite | FALSO | FALSO |
| ts_language | Cadeia de caracteres | Coluna | Ambos | Adicionado para permitir a indexação de texto somente de idiomas específicos. | Idioma de pesquisa de texto | VERDADEIRO | FALSO |
| ts_multi_value_field_splitter | Cadeia de caracteres | Coluna | Ambos | Se um campo for um campo de vários valores, adicione o divisor no campo neste atributo para distribuir as posições de índice dos valores. Por exemplo, para separar multi:value, coloque : para este atributo. | Divisor de campo de vários valores da pesquisa de texto | VERDADEIRO | VERDADEIRO |
| ts_weight | Número inteiro | Coluna | Ambos | Controla a importância relativa de uma correspondência no campo para pesquisa de texto. Para obter mais informações sobre como o valor de ponderação afeta a relevância do resultado da pesquisa, consulte Zing calcula pontuações de documentos usando três componentes. Para saber como definir o peso da pesquisa de texto para um campo, consulte Defina o peso relativo de um campo. | Peso da pesquisa de texto | FALSO | FALSO |
no_text_index
Para Suporte e atendimento ao cliente diretrizes sobre como definir o. no_text_index para diferentes tipos de campo, consulte KB0859922 em Now Support site.
texto_index_scorer_bm25_b
Este atributo de dicionário faz parte do algoritmo BM25. O atributo afeta a importância do tamanho de um documento nos resultados da pesquisa. Se este atributo for 0, o comprimento não terá rolamento. Neste caso, um documento de duas palavras seria avaliado igualmente como um documento com 1000 palavras. Documentos muito curtos geralmente são ponderados mais baixos do que documentos mais longos. O padrão é 0,75.
texto_index_scorer_bm25_k1
Este atributo de dicionário faz parte do algoritmo BM25. O atributo ajuda a determinar as características de saturação de frequência do termo, ou seja, fazer com que o termo de pesquisa apareça em um documento aumenta a relevância do documento, mas o aumento é menos impactante conforme os números sobem. Por exemplo, um termo de pesquisa que ocorre 10 vezes em um documento o torna mais relevante do que um documento que tem apenas uma ocorrência. No entanto, um documento que tem 100 ocorrências do termo de pesquisa pode não ser dez vezes mais impactante do que um documento que tem 10 ocorrências. A relevância se aproxima de uma assíntota máxima de efeito. Quanto maior o valor do atributo, menor será o efeito máximo de várias ocorrências. Os valores típicos estão entre 1,25 e 2,0.