Zing indiziert Wörter

  • Freigeben Version: Xanadu
  • Aktualisiert 1. August 2024
  • 1 Minute Lesedauer
  • Indexieren Sie Dokumente, indem Sie sie in Wörter unterteilen. Abhängig von den Sprachen, die Ihre -Instanz unterstützt, kann ein Wort ein einzelnes Zeichen wie ein Chinesisch- oder Japanisch-Piktogramm oder eine Folge von durch Leerzeichen getrennten Zeichen sein, wie bei den Sprachen Latein, Arabisch und PINyin.

    Zing verwendet Leerzeichen, um die Grundeinheit für die Worttrennung zu definieren. Zing verwendet die folgenden Regeln, um Wörter zu indizieren.

    Tabelle : 1. Zing-Wortindexierungsregeln
    Regel Verhalten
    Interpunktion Zing indiziert einige Satzzeichen als Teil einiger Wörter, um die Suchergebnisse für häufige Suchbegriffe zu verbessern. Zing konvertiert alle nicht indizierten Interpunktionszeichen in Leerzeichen. Weitere Informationen finden Sie unter Zing indiziert Interpunktion als Teil einiger Wörter.
    Piktogramme Zing unterstützt alle Unicode-Piktogrammzeichen. Jedes Chinesisch- oder Japanisch-Piktogramm wird als separates Wort indiziert, als ob es ein einzelnes Latein-1-Zeichen wäre, das von Leerzeichen umgeben ist.
    Buchstabe Zing behandelt die Zeichen „Lateinisch-1“, „Arabisch“ und „Pinyin“ als einzelne Buchstaben durch Leerzeichen getrennter Wörter. Buchstabensequenzen definieren indizierbare Wörter.