Zing indiziert Wörter
Indizieren Sie Dokumente, indem Sie sie in Wörter unterteilen. Je nach den Sprachen, die Ihre Instanz unterstützt, kann ein Wort ein einzelnes Zeichen wie ein chinesisches oder japanisches Piktogramm oder eine durch Leerzeichen getrennte Zeichenfolge sein, z. B. bei lateinischen, arabischen und Pinyin-Sprachen.
Zing verwendet Leerzeichen, um die grundlegende Einheit der Worttrennung zu definieren. Zing verwendet die folgenden Regeln, um Wörter zu indizieren.
| Regel | Verhalten |
|---|---|
| Interpunktion | Zing indiziert einige Interpunktionszeichen als Teil einiger Wörter, um die Suchergebnisse für allgemeine Suchbegriffe zu verbessern. Zing konvertiert alle nicht indizierten Interpunktionszeichen in Leerzeichen. Weitere Informationen finden Sie unter Zing indiziert die Interpunktion als Teil einiger Wörter. |
| Piktogramme | Zing unterstützt den gesamten Bereich von Unicode-Piktogrammzeichen. Jedes chinesische oder japanische Piktogramm wird als separates Wort indiziert, als wäre es ein einzelnes lateinisches 1-Zeichen, das von Leerzeichen umgeben ist. |
| Buchstabe | Zing behandelt lateinische 1-, arabische und Pinyin-Zeichen als einzelne Buchstaben von durch Leerzeichen getrennten Wörtern. Buchstabensequenzen definieren indizierbare Wörter. |