Zing indiziert Wörter
Indexieren Sie Dokumente, indem Sie sie in Wörter aufteilen. Abhängig von den Sprachen, die Ihre Instanz unterstützt, kann ein Wort ein einzelnes Zeichen sein, z. B. ein Chinesisch- oder Japanisch-Piktogramm, oder eine Sequenz von durch Leerzeichen getrennten Zeichen, z. B. bei Latein, Arabisch und Pinyin.
Zing verwendet Leerzeichen, um die Basiseinheit der Worttrennung zu definieren. Zing verwendet die folgenden Regeln, um Wörter zu indizieren.
| Regel | Verhalten |
|---|---|
| Interpunktion | Zing indiziert einige Satzzeichen als Teil einiger Wörter, um die Suchergebnisse für häufig verwendete Suchbegriffe zu verbessern. Zing konvertiert alle nicht indizierten Satzzeichen in Leerzeichen. Weitere Informationen finden Sie unter Zing indiziert Satzzeichen als Teil einiger Wörter. |
| Piktogramme | Zing unterstützt alle Unicode-Piktogrammzeichen. Jedes Chinesisch- oder Japanisch-Piktogramm wird als separates Wort indiziert, als wäre es ein einzelnes Latein-1-Zeichen, das von Leerzeichen umgeben ist. |
| Buchstabe | Zing behandelt Lateinisch-1-, Arabisch- und Pinyin-Zeichen als einzelne Buchstaben von durch Leerzeichen getrennten Wörtern. Buchstabensequenzen definieren indizierbare Wörter. |