Zing indiziert Wörter

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 1 Minute Lesedauer
  • Indexieren Sie Dokumente, indem Sie sie in Wörter aufteilen. Abhängig von den Sprachen, die Ihre Instanz unterstützt, kann ein Wort ein einzelnes Zeichen sein, z. B. ein Chinesisch- oder Japanisch-Piktogramm, oder eine Sequenz von durch Leerzeichen getrennten Zeichen, z. B. bei Latein, Arabisch und Pinyin.

    Zing verwendet Leerzeichen, um die Basiseinheit der Worttrennung zu definieren. Zing verwendet die folgenden Regeln, um Wörter zu indizieren.

    Tabelle : 1. Zing-Wortindizierungsregeln
    Regel Verhalten
    Interpunktion Zing indiziert einige Satzzeichen als Teil einiger Wörter, um die Suchergebnisse für häufig verwendete Suchbegriffe zu verbessern. Zing konvertiert alle nicht indizierten Satzzeichen in Leerzeichen. Weitere Informationen finden Sie unter Zing indiziert Satzzeichen als Teil einiger Wörter.
    Piktogramme Zing unterstützt alle Unicode-Piktogrammzeichen. Jedes Chinesisch- oder Japanisch-Piktogramm wird als separates Wort indiziert, als wäre es ein einzelnes Latein-1-Zeichen, das von Leerzeichen umgeben ist.
    Buchstabe Zing behandelt Lateinisch-1-, Arabisch- und Pinyin-Zeichen als einzelne Buchstaben von durch Leerzeichen getrennten Wörtern. Buchstabensequenzen definieren indizierbare Wörter.