Zing berechnet Dokumentpunktzahlen mit drei Komponenten

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 2 Minuten Lesedauer
  • Die Zing-Suchmaschine berechnet Dokumentpunktzahlen basierend auf der Häufigkeit, der Reihenfolge und der Gewichtung der Suchbegriffe im Dokument.

    Dokumentpunktzahlen

    Die Komponenten einer Dokumentpunktzahl für eine Suchabfrage sind:
    • Häufigkeit : Wie oft die Suchbegriffe im Dokument angezeigt werden.
    • Sequenz : Wie oft die Suchbegriffe in derselben Reihenfolge wie die Suchabfrage angezeigt werden.
    • Gewichtung : Wie stark das Quellfeld gewichtet ist, in dem die Suchbegriffe angezeigt werden.
    Abbildung : 1. Beispiel für die Berechnung der Dokumentpunktzahl
    Grafik mit Häufigkeits- und Sequenzbewertung für Beispielsuchabfrage und -Dokument.

    Häufigkeitspunkte

    Zing vergibt einen Punkt, wenn ein Suchbegriff an einer beliebigen Stelle im Dokument angezeigt wird. Zum Beispiel bei der Suche nach Verteilter Datenbankserver , Ein Dokument, das enthält Verteilt Dreimal, Datenbank Fünf Mal, und Server 17 Mal hätten 25 Frequenzpunkte.

    Um die Suchergebnispunktzahlen von Suchbegriffen zu erhöhen, die häufiger in einem Dokument, aber weniger häufig in einem Dokumentsatz angezeigt werden, können Sie Folgendes tun Suchbegriffe nach umgekehrter Dokumenthäufigkeit bewerten (IDF). Wenn TF-IDF aktiviert ist, werden Suchbegriffspunktzahlen berechnet, indem die Häufigkeitspunktzahl der Begriffe mit der Häufigkeitspunktzahl des inversen Dokuments multipliziert wird. Da die Aktivierung von TF-IDF die Gewichtung weniger gängiger Suchbegriffe erhöht, sind die Suchergebnisse für diese Tabelle wahrscheinlicher relevant. Zum Beispiel bei der Suche nach Verteilter Datenbankserver , Die Bedingung Verteilt Erhält möglicherweise eine höhere Punktzahl als Server Wenn sie häufig in einem Dokument, aber weniger häufig im Dokument als Ganzes angezeigt wird.

    Zing wendet einen Multiplikator auf Häufigkeitspunkte basierend auf dem Wert von an ts_weightAttribut für das Feld, in dem der Suchbegriff angezeigt wird. Ein Feld mit einer Bewertungsgewichtung der Textsuche von 30 ( ts_weight=30) Würde 30 Punkte für jede Aufnahme eines Suchbegriffs hinzufügen.

    Sequenzpunkte

    Zing verleiht einem Dokument weitere Punkte, wenn es die Suchbegriffe in derselben Reihenfolge enthält, in der sie eingegeben wurden. Je mehr Suchbegriffe in Reihenfolge vorhanden sind, desto exponentiell höher wird die Punktzahl. Zing vergibt Sequenzpunkte als 10^x, wobei x die Anzahl der Suchbegriffe ist, die in der Reihenfolge angezeigt werden.

    In Verteilter Datenbankserver Suchbeispiel: Zing vergibt ein Dokument 100 (10^2) Sequenzpunkte für jedes Mal, wenn es die zweizeilige Zeichenfolge enthält Datenbankserver . Ebenso vergibt Zing ein Dokument jedes Mal 1000 (10^3) Sequenzpunkte, wenn es die dreizeitige Zeichenfolge enthält Verteilter Datenbankserver .

    Zing wendet einen Multiplikator auf Sequenzpunkte basierend auf dem Wert von an ts_weightAttribut für das Feld, in dem die Sequenz angezeigt wird. Die Sequenzpunkte verwenden die Berechnung (Feld 10^x * ts_weightAttribut).

    Gewichtungen der Feldbewertung

    Das System erhöht die Standardbewertungsgewichtung von Wissen Datensatznummern, Wissen Kurzbeschreibungen und Metadaten, Aufgabendatensatznummern und Kurzbeschreibungen der Aufgabe. Standard ts_weightAttribute für diese Felder lauten wie folgt:
    • kb_knowledge.number = 50
    • kb_knowledge.short_description = 10
    • kb_knowledge.meta = 10
    • task.number = 50
    • task.short_description = 10

    Alle anderen Felder haben einen Standard ts_weightAttribut von 1. Der maximal mögliche Gewichtungswert ist 255.