カスタムストップワードリストを作成する

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:1分
  • トレーニングと予測中にシステムが無視する一般的な単語を除外します。

    始める前に

    必要なロール:admin または ml_admin

    このタスクについて

    ストップワードリストを使用すると、検索やデータ全体の自然言語処理を妨げる可能性のある無関係な単語を除外できます。

    予測インテリジェンス には、システムがサポートする各言語のデフォルトのストップワードリストが用意されています。ストップワードの例としては、 inthe、人や会社の名前などの単語があります。組織や業界に固有の単語で構成される独自のストップワードリストを定義することもできます。

    指定したカスタムリストは、デフォルトで既に使用されているリストと一緒に機能します。たとえば、インシデントレコードが分類ソリューションで使用され、それらのレコードで会社名が使用されている場合、ビルドしているソリューションに関連する情報が提供される可能性は低いため、その名前をリストに追加することを検討してください。

    このシナリオ例では、ブラジルポルトガル語のカスタムストップワードリストを作成します。

    手順

    1. 移動先 すべて > 予測インテリジェンス > ストップワード.
    2. [ストップワード] ボックスの一覧で、[ 新規] をクリックします。
      この画像は、このリリースでサポートされているさまざまな処理言語のデフォルトのストップワードリストのリストを示しています。
    3. ストップワードフォームで、次のフィールドを設定します。
      フィールド
      名前 会社の名前や処理言語など、リストの一意の名前を入力します。たとえば、「 Blitzo Brazilian Portuguese Stopwords」などです。
      ストップワードの言語 ブラジル系ポルトガル語を選択
      ストップワードのリスト ストップワードをカンマ区切り形式で手動で入力します。ストップワードのその他の例については、この手順のステップ 2 の画像を参照してください。
      この画像は、カスタムストップワードリストのブラジルポルトガル語ストップワードのリストの例を示しています。
    4. [送信] をクリックします。
      カスタムストップワードリストが [ストップワード] リストビューに表示されます。
      ストップワードリストを送信すると、ストップワードリストビューに表示されます。
    5. オプション: ストップワードリストを更新する必要がある場合は、その名前をクリックし、リストの単語を追加または削除して、[ 更新]をクリックします。
      この画像は、必要に応じてストップワードリストを更新する方法を示しています。

    次のタスク

    カスタムまたはデフォルトのストップワードリストを、分類、類似性、クラスタリング、または 回帰 ソリューション定義にアサインします。