テキスト分析ストップワードの選択

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:2分
  • テキスト分析から除外する単語を選択します。インジケーター ソースまたはインジケーター レベルのいずれかで単語を除外できます。

    始める前に

    必要なロール:pa_analyst または pa_admin

    このタスクについて

    インジケーター ソースまたはインジケーター レベルのいずれかに適用するストップワードを選択します。インジケーターのストップワードを選択すると、ストップワードが適用されるスコアをブレークダウンおよびブレークダウン要素でフィルタリングできます。インジケーター ソースのストップワードを選択すると、それらをデータ収集から除外します。その結果、インデックスに無駄がなくなります。

    デフォルトでは、このフォームで選択したストップワードに加えて、Zing グローバル ストップワードが適用されます。この動作はテキスト インデックス構成で無効にすることができます。現在のストップワードのリストを見つけるには、インスタンス上の システム定義 > テキストインデックスのストップワード.

    手順

    1. 移動先 テキストアナリティクス > ストップワード をクリックし、[ New] をクリックします。
    2. [タイプ] フィールドで、[インジケーター] または [インジケーターソース] を選択します。
      インジケーターを指定すると、1 つまたは 2 つのレベルのブレークダウンでテキストをフィルタリングできます。

      インジケーターソースを指定すると、無駄のないインデックスを維持するために、ストップワードがデータ収集から削除されます。ただし、これらのストップワードは、[ストップワード] フィールドから削除しても、すぐにウィジェットに戻すことはできません。次のデータ収集まで表示されません。

      インジケーターで指定されたストップワードは、インデックスに残ります。これらのストップワードは、[ストップワード] リストから削除することですぐにウィジェットに戻すことができますが、インデックスのサイズがパフォーマンスに影響する可能性があります。

    3. ストップワードの適用先として [インジケーター] または [インジケーターソース] を選択します。
    4. オプション: ブレークダウンでテキストをフィルタリングするには、[ブレークダウン] フィールドと最初の [要素] フィールドで値を選択します。
      ブレークダウンを選択しても要素を選択しなかった場合、ウィジェットはブレークダウンの要素に関連付けられていないテキストのみを分析します。
    5. オプション: ブレークダウンを選択し、2 番目のブレークダウンでテキストをフィルタリングする場合は、[ブレークダウンレベル 2] フィールドと 2 番目の [要素] フィールドで値を選択します。
    6. [ストップワード] フィールドで、テキスト分析から除外する単語をカンマで区切って入力します。
    7. [送信] をクリックします。