O Zing calcula as pontuações do documento usando três componentes
O mecanismo de pesquisa do Zing calcula as pontuações do documento com base na frequência, sequência e peso dos termos de pesquisa no documento.
Pontuações do documento
- Frequência: a frequência com que os termos de pesquisa aparecem no documento.
- Sequência: com que frequência os termos de pesquisa aparecem na mesma ordem que a consulta de pesquisa.
- Peso: o peso do campo de origem no qual os termos de pesquisa aparecem.
Pontos de frequência
O Zing concede um ponto sempre que um termo de pesquisa aparece em qualquer lugar no documento. Por exemplo, ao pesquisar servidor de banco de dados distribuído, um documento que contém distribuído três vezes, banco de dados cinco vezes e servidor 17 vezes teria 25 pontos de frequência.
Para aumentar as pontuações dos termos de pesquisa que aparecem com mais frequência em um documento, mas com menos frequência em um conjunto de documentos, você pode Pontuar termos de pesquisa por frequência inversa de documentos (IDF). Quando o TF-IDF está habilitado, as pontuações do termo de pesquisa são calculadas multiplicando a pontuação de frequência do termo pela pontuação de frequência inversa do documento. Como a habilitação do TF-IDF aumenta o peso dos termos de pesquisa menos comuns, os resultados da pesquisa para essa tabela têm maior probabilidade de serem relevantes. Por exemplo, ao pesquisar servidor de banco de dados distribuído, o termo distribuído pode receber uma pontuação mais alta do que servidor se aparecer com frequência em um documento, mas com menos frequência no conjunto de documentos como um todo.
O Zing aplica um multiplicador a pontos de frequência com base no valor do atributo ts_weight do campo em que o termo de pesquisa aparece. Um campo com um peso de pontuação de pesquisa de texto de 30 (ts_weight=30) adicionaria 30 pontos para cada inclusão de um termo de pesquisa.
Pontos de sequência
O Zing concede mais pontos a um documento quando ele contém os termos de pesquisa na mesma ordem em que foram digitados. Quanto mais termos de pesquisa na sequência houver, exponencialmente maior será a pontuação. O Zing concede pontos de sequência como 10^x, em que x é o número de termos de pesquisa que aparecem em sequência.
No exemplo de pesquisa de servidor de banco de dados distribuído, o Zing concede a um documento 100 (10^2) pontos de sequência para cada vez que inclui o servidor de bancode dados de cadeia de caracteres de dois termos . Da mesma forma, o Zing concede a um documento 1000 (10^3) pontos de sequência sempre que ele inclui o servidor de banco de dados distribuídode cadeia de caracteres de três termos .
O Zing aplica um multiplicador a pontos de sequência com base no valor do atributo ts_weight para o campo no qual a sequência aparece. Os pontos de sequência usam o cálculo (atributo 10^x * field ts_weight ).
Ponderações de pontuação do campo
- kb_knowledge.number = 50
- kb_knowledge.short_description = 10
- kb_knowledge.meta = 10
- task.number = 50
- task.short_description = 10
Todos os outros campos têm um atributo padrão ts_weight de 1. O valor máximo de peso possível é 255.