Zing インデックスワード
ドキュメントを単語に分割してインデックスを作成します。インスタンスがサポートする言語に応じて、単語は中国語や日本語の象形文字などの単一文字であったり、またはラテン語、アラビア語、ピンイン言語などのスペースで区切られた文字のシーケンスであったりする場合があります。
Zing はスペースを使用して、単語区切りの基本単位を定義します。Zing は、次のルールを使用して単語にインデックスを付けます。
| ルール | 動作 |
|---|---|
| 句読点 | Zing は、一般的な検索用語の検索結果を改善するために、いくつかの単語ではその一部として句読点にインデックスを付けます。Zing は、インデックス付けされていない句読点文字をスペースに変換します。「Zing によるいくつかの単語の一部としての句読点のインデックス付け」を参照してください。 |
| ピクトグラム | Zing は、Unicode ピクトグラム文字の全範囲をサポートしています。中国語または日本語の各ピクトグラムは、スペースで囲まれた単一の Latin-1 文字であるかのように、個別の単語としてインデックス付けされます。 |
| 文字 | Zing では、Latin-1、アラビア文字、ピンイン文字は、スペースで区切られた単語の個々の文字として扱われます。文字のシーケンスは、インデックス付け可能な単語を定義します。 |