日本語を対象としたテキスト分析について

Kohhei
Tera Contributor

問合せの内容について、テキスト分析の機能を使用してWord Cloudで表示させたいと考えています。

Docsの内容に従ってPDIで実装してみたところ、カタカナは単語で拾えているものがありましたが、それ以外は下記のように1文字ごとに区切られてしまいました。

Kohhei_0-1712304038831.png

 

調べたところ、テキストインデックスの作成時に日本語トークナイザーを使用するよう設定をするというものが見つかったので、上記事象にも有効か?と思い試してみましたが、状況は変わらずでした。

こちらの投稿では、形態素解析が使えないレベル、日本語には対応していないなどのコメントがあり、やはり使えないのだろうかと思っておりますが、何か他に情報をお持ちの方がいたら共有頂けますと幸いです。
並行してサポートに仕様の確認をしたいと思います。

5件の返信5

返信ありがとうございます。
日本語で使えないものとされているから、皆さん使っていないため、実際にインシデントとして上がって来ないのではと思料しています。

私としても業務で使っているわけでなく、この機能が使えると既存の日本語のテキスト検索機能が、どのように向上するのかを試してみたく、いつ使えるようになるのかが気になっただけです。