Zing berechnet Dokumentpunktzahlen mit drei Komponenten
Die Zing-Suchmaschine berechnet Dokumentpunktzahlen basierend auf der Häufigkeit, der Reihenfolge und der Gewichtung der Suchbegriffe im Dokument.
Dokumentpunktzahlen
- Häufigkeit : Wie oft die Suchbegriffe im Dokument angezeigt werden.
- Sequenz : Wie oft die Suchbegriffe in derselben Reihenfolge wie die Suchabfrage angezeigt werden.
- Gewichtung : Wie stark das Quellfeld gewichtet ist, in dem die Suchbegriffe angezeigt werden.
Häufigkeitspunkte
Zing vergibt einen Punkt, wenn ein Suchbegriff an einer beliebigen Stelle im Dokument angezeigt wird. Zum Beispiel bei der Suche nach Verteilter Datenbankserver , Ein Dokument, das enthält Verteilt Dreimal, Datenbank Fünf Mal, und Server 17 Mal hätten 25 Frequenzpunkte.
Um die Suchergebnispunktzahlen von Suchbegriffen zu erhöhen, die häufiger in einem Dokument, aber weniger häufig in einem Dokumentsatz angezeigt werden, können Sie Folgendes tun Suchbegriffe nach umgekehrter Dokumenthäufigkeit bewerten (IDF). Wenn TF-IDF aktiviert ist, werden Suchbegriffspunktzahlen berechnet, indem die Häufigkeitspunktzahl der Begriffe mit der Häufigkeitspunktzahl des inversen Dokuments multipliziert wird. Da die Aktivierung von TF-IDF die Gewichtung weniger gängiger Suchbegriffe erhöht, sind die Suchergebnisse für diese Tabelle wahrscheinlicher relevant. Zum Beispiel bei der Suche nach Verteilter Datenbankserver , Die Bedingung Verteilt Erhält möglicherweise eine höhere Punktzahl als Server Wenn sie häufig in einem Dokument, aber weniger häufig im Dokument als Ganzes angezeigt wird.
Zing wendet einen Multiplikator auf Häufigkeitspunkte basierend auf dem Wert von an ts_weightAttribut für das Feld, in dem der Suchbegriff angezeigt wird. Ein Feld mit einer Bewertungsgewichtung der Textsuche von 30 ( ts_weight=30) Würde 30 Punkte für jede Aufnahme eines Suchbegriffs hinzufügen.
Sequenzpunkte
Zing verleiht einem Dokument weitere Punkte, wenn es die Suchbegriffe in derselben Reihenfolge enthält, in der sie eingegeben wurden. Je mehr Suchbegriffe in Reihenfolge vorhanden sind, desto exponentiell höher wird die Punktzahl. Zing vergibt Sequenzpunkte als 10^x, wobei x die Anzahl der Suchbegriffe ist, die in der Reihenfolge angezeigt werden.
In Verteilter Datenbankserver Suchbeispiel: Zing vergibt ein Dokument 100 (10^2) Sequenzpunkte für jedes Mal, wenn es die zweizeilige Zeichenfolge enthält Datenbankserver . Ebenso vergibt Zing ein Dokument jedes Mal 1000 (10^3) Sequenzpunkte, wenn es die dreizeitige Zeichenfolge enthält Verteilter Datenbankserver .
Zing wendet einen Multiplikator auf Sequenzpunkte basierend auf dem Wert von an ts_weightAttribut für das Feld, in dem die Sequenz angezeigt wird. Die Sequenzpunkte verwenden die Berechnung (Feld 10^x * ts_weightAttribut).
Gewichtungen der Feldbewertung
- kb_knowledge.number = 50
- kb_knowledge.short_description = 10
- kb_knowledge.meta = 10
- task.number = 50
- task.short_description = 10
Alle anderen Felder haben einen Standard ts_weightAttribut von 1. Der maximal mögliche Gewichtungswert ist 255.