Zing indiziert Wörter
Indexieren Sie Dokumente, indem Sie sie in Wörter unterteilen. Abhängig von den Sprachen, die Ihre -Instanz unterstützt, kann ein Wort ein einzelnes Zeichen wie ein Chinesisch- oder Japanisch-Piktogramm oder eine Folge von durch Leerzeichen getrennten Zeichen sein, wie bei den Sprachen Latein, Arabisch und PINyin.
Zing verwendet Leerzeichen, um die Grundeinheit für die Worttrennung zu definieren. Zing verwendet die folgenden Regeln, um Wörter zu indizieren.
| Regel | Verhalten |
|---|---|
| Interpunktion | Zing indiziert einige Satzzeichen als Teil einiger Wörter, um die Suchergebnisse für häufige Suchbegriffe zu verbessern. Zing konvertiert alle nicht indizierten Interpunktionszeichen in Leerzeichen. Weitere Informationen finden Sie unter Zing indiziert Interpunktion als Teil einiger Wörter. |
| Piktogramme | Zing unterstützt alle Unicode-Piktogrammzeichen. Jedes Chinesisch- oder Japanisch-Piktogramm wird als separates Wort indiziert, als ob es ein einzelnes Latein-1-Zeichen wäre, das von Leerzeichen umgeben ist. |
| Buchstabe | Zing behandelt die Zeichen „Lateinisch-1“, „Arabisch“ und „Pinyin“ als einzelne Buchstaben durch Leerzeichen getrennter Wörter. Buchstabensequenzen definieren indizierbare Wörter. |