カスタムストップワードリストを作成する

  • リリースバージョン: Washingtondc
  • 更新日 2024年02月01日
  • 1 読むのに数分読む
  • トレーニングおよび予測中にシステムが無視する一般的な単語を除外します。

    始める前に

    必要なロール:admin または ml_admin

    このタスクについて

    ストップワードリストを使用すると、検索やデータの全体的な自然言語処理を妨げる可能性のある無関係な単語を除外できます。

    予測インテリジェンス は、システムがサポートする各言語のデフォルトのストップワードリストを提供します。ストップワードの例としては、 inthe、人や会社の名前などの単語があります。組織や業界に固有の単語で構成される独自のストップワードリストを定義することもできます。

    指定したカスタムリストは、システムがデフォルトで既に使用しているリストと連動して機能します。たとえば、インシデントレコードが分類ソリューションで使用されていて、それらのレコードで会社名が使用されている場合、構築しているソリューションに関連する情報が提供される可能性が低いため、その名前をリストに追加することを検討してください。

    この例のシナリオでは、ブラジルポルトガル語のカスタムストップワードリストを作成します。

    手順

    1. 移動先 すべて > 予測インテリジェンス > ストップワード.
    2. [ストップワード] ボックスの一覧で、[ 新規] をクリックします。
      この画像は、このリリースでサポートされているさまざまな処理言語のデフォルトのストップワードリストのリストを示しています。
    3. [ストップワード] フォームで、次のフィールドを設定します。
      フィールド
      名前 会社名や処理言語など、リストの一意の名前を入力します。例: Blitzo Brazilian Portuguese Stopwords
      ストップワードの言語 ブラジル系ポルトガル語を選択
      ストップワードのリスト ストップワードをカンマ区切り形式で手動で入力します。ストップワードのその他の例については、この手順のステップ 2 の画像を参照してください。
      この画像は、カスタムストップワードリストのブラジル系ポルトガル語ストップワードのリストの例を示しています。
    4. [Submit (送信)] をクリックします。
      カスタムストップワードリストがストップワードリストビューに表示されます。
      ストップワードリストを送信すると、ストップワードリストビューに表示されます。
    5. オプション: ストップワードリストを更新する必要がある場合は、その [名前] をクリックし、リストの単語を追加または削除して、[ 更新] をクリックします。
      この画像は、必要に応じてストップワードリストを更新する方法を示しています。

    次のタスク

    分類、類似性、クラスタリング、または 回帰 ソリューション定義にカスタムまたはデフォルトのストップワードリストを割り当てます。