Zing berechnet Dokumentpunktzahlen mit drei Komponenten

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 2 Minuten Lesedauer
  • Die Zing-Suchmaschine berechnet Dokumentpunktzahlen basierend auf der Häufigkeit, der Reihenfolge und der Gewichtung der Suchbegriffe im Dokument.

    Dokumentieren Sie Punktzahlen

    Die Komponenten einer Dokumentpunktzahl für eine Suchabfrage sind:
    • Häufigkeit : Wie oft die Suchbegriffe im Dokument angezeigt werden.
    • Sequenz : Wie oft die Suchbegriffe in derselben Reihenfolge wie die Suchabfrage angezeigt werden.
    • Gewichtung : Wie stark das Quellfeld gewichtet ist, in dem die Suchbegriffe angezeigt werden.
    Abbildung : 1. Beispieldokument-Punktzahlberechnung
    Grafik mit Häufigkeits- und Sequenzbewertung für Beispielsuchabfrage und -Dokument.

    Häufigkeitspunkte

    Zing vergibt einen Punkt, wenn ein Suchbegriff an einer beliebigen Stelle im Dokument angezeigt wird. Beispiel: Bei der Suche nach Verteilter Datenbankserver , Ein Dokument, das enthält Verteilt Dreimal, Datenbank Fünf Mal, und Server 17 Mal hätten 25 Häufigkeitspunkte.

    Um die Suchergebnispunktzahlen von Suchbegriffen zu erhöhen, die häufiger in einem Dokument, aber weniger häufig in einem Dokumentsatz angezeigt werden, können Sie Folgendes tun Suchbegriffe nach umgekehrter Dokumenthäufigkeit (IDF) bewerten. Wenn TF-IDF aktiviert ist, werden Suchbegriffspunktzahlen berechnet, indem die Häufigkeitspunktzahl der Begriffe mit der Häufigkeitspunktzahl des inversen Dokuments multipliziert wird. Da die Aktivierung von TF-IDF die Gewichtung weniger gängiger Suchbegriffe erhöht, sind die Suchergebnisse für diese Tabelle wahrscheinlicher relevant. Beispiel: Bei der Suche nach Verteilter Datenbankserver , Die Bedingung Verteilt Erhält möglicherweise eine höhere Punktzahl als Server Wenn sie häufig in einem Dokument, aber weniger häufig im Dokument als Ganzes angezeigt wird.

    Zing wendet einen Multiplikator auf Häufigkeitspunkte basierend auf dem Wert von an ts_weightAttribut für das Feld, in dem der Suchbegriff angezeigt wird. Ein Feld mit einer Gewichtung der Textsuche-Bewertung von 30 ( ts_weight=30) Würde 30 Punkte für jede Aufnahme eines Suchbegriffs hinzufügen.

    Sequenzpunkte

    Zing verleiht einem Dokument weitere Punkte, wenn es die Suchbegriffe in derselben Reihenfolge enthält, in der sie eingegeben wurden. Je mehr Suchbegriffe in Reihenfolge vorhanden sind, desto exponentiell höher wird die Punktzahl. Zing weist Sequenzpunkte als 10^x zu, wobei x die Anzahl der Suchbegriffe ist, die in der Reihenfolge angezeigt werden.

    In Verteilter Datenbankserver Suchbeispiel: Zing vergibt ein Dokument 100 (10^2) Sequenzpunkte für jedes Mal, wenn es die zweistellige Zeichenfolge enthält Datenbankserver . Ebenso vergibt Zing ein Dokument jedes Mal, wenn es die dreistellige Zeichenfolge enthält, 1000 (10^3) Sequenzpunkte Verteilter Datenbankserver .

    Zing wendet einen Multiplikator auf Sequenzpunkte basierend auf dem Wert von an ts_weightAttribut für das Feld, in dem die Sequenz angezeigt wird. Die Sequenzpunkte verwenden die Berechnung (Feld 10^x * ts_weightAttribut).

    Gewichtungen der Feldbewertung

    Das System erhöht die Standardbewertungsgewichtung von WissenDatensatznummern, WissenKurzbeschreibungen und Metadaten, Aufgabendatensatznummern und Kurzbeschreibungen der Aufgabe. Standard ts_weightAttribute für diese Felder:
    • kb_knowledge.number = 50
    • kb_knowledge.short_description = 10
    • kb_knowledge.meta = 10
    • task.number = 50
    • task.short_description = 10

    Alle anderen Felder haben einen Standard ts_weightAttribut von 1. Der maximal mögliche Gewichtungswert ist 255.