ワードコーパスの作成

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:4分
  • システムがテキストの類似性に基づいてインスタンスレコードを比較するために使用する語彙として機能する単語やフレーズのコレクションを構築します。ワードコーパスは、機械学習システムに理解してもらいたい辞書と考えることができます。

    始める前に

    必要なロール:ml_admin または admin

    このタスクについて

    重要:
    Xanadu リリースでは、クラスタリングおよび類似性モデルはワークフローソリューションを使用します。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、ワークフローソリューションになり、[ワードコーパス] フィールドがフォームから削除されます。

    次の情報は、従来のコンテキスト用に提供されています。

    ワードコーパスの主な目的は、 NLU モデルをトレーニングするためのテキストデータを推測することです。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズのトレーニング用にワードコーパスを指定する必要があります。トレーニング済みのワードコーパスは、ソリューションや機能全体で再利用できます。

    ワードコーパスを使用して、テーブル内または複数のテーブル間で類似のレコードテキストを比較することができます。ワードコーパスは、データ分析、再利用、またはレビューのために類似のレコードをグループ化するクラスタリングなどの他のシナリオでも役立ちます。コーパスに追加するアイテムは、他の類似性ソリューションやクラスタリングソリューションで再利用したり、さまざまなユースケースに適用できるように、会社や業界に固有のものにする必要があります。

    この手順例では、インシデントレコードを操作しており、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を探します。ここでの目標は、アクティブなインシデントと公開された KB 記事を比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。

    手順

    1. 移動先 すべて > 予測インテリジェンス > ワードコーパス.
    2. [ワードコーパス] フォームで、[ 新規] をクリックします。
    3. これらのフィールドは、次のガイダンスに従って構成します。
      フィールド 説明
      名前 コーパスのコンテンツを参照する一意のタイトル。たとえば、このユースケースでは、「 アクティブなインシデント」や「公開された KB」などの名前を入力できます。名前は、ソリューションの作成に役立てるためにコーパスがマイニングするテーブルを示すためです。
      アクティブ 一度に複数のワードコーパスを作成し、後で詳細コンポーネントを構成する場合は、このチェックボックスをオンにします。それ以外の場合は、後の手順で選択できるため、空白のままにします。
    4. [送信] をクリックします。
    5. [ワードコーパス] リストビューで、新しいワードコーパスを見つけてその [名前 ] 値をクリックし、レコードを開きます。
    6. [ワードコーパスコンテンツ] セクションで、[ 新規] をクリックします。
    7. ワードコーパスコンテンツフォームで、次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスのコンテンツコンポーネントを定義します。
      フィールド 説明
      名前 コーパスに追加するデータを参照するタイトル ( 過去 6 か月間にクローズされたインシデントなど) を入力します。
      テーブル ワードコーパスに含めるデータが含まれているテーブルを選択します。このユースケースでは、 インシデント [incident] を選択します。
      注:
      類似性およびクラスタリングソリューションで使用されるワードコーパス作成用のテーブルあたりのレコード数は 300,000 に制限されています。
      フィルター [ クローズ済み]、[は空でない]、および [過去 6 か月間に作成] のフィルター条件値を選択します。
      フィールドリスト このユースケースでは、[ 簡単な説明]、[ 説明]、および [解決メモ] を選択します。
      ドメイン コーパスのユーザーグループが自動的に表示されます。たとえば、このユースケースでは、グローバルユーザーグループが表示されます。他のユーザーグループも選択できます。
    8. [送信] をクリックします。
    9. [ワードコーパスの詳細] セクションで、[ 新規] をクリックします。
    10. 以下のガイダンスに従ってこれらのフィールドを構成し、ワードコーパスの 2 番目のコンテンツコンポーネントを定義します。
      フィールド 説明
      名前 最初のコンテンツコンポーネントと比較するデータを参照するタイトル ( 「公開済み KB 記事」など) を入力します。
      テーブル 最初のコンテンツコンポーネントと比較するデータが含まれているテーブルを選択します。このユースケースでは、 ナレッジ [kb_knowledge] を選択します。
      注:
      類似性およびクラスタリングソリューションで使用されるワードコーパス作成のテーブルあたりのレコード数は、テーブルあたり 300,000 レコードに制限されています。
      フィルター フィルター条件の [ワークフロー] [次の値に等しい] [公開済み] を選択します。
      フィールドリスト [Short description (簡単な説明)][Article body (記事本文)] を選択します。
    11. [送信] をクリックします。

      2 つのワードコーパスコンテンツコンポーネントがワードコーパスフォームに表示されます。

      この画像は、ワードコーパス用に作成した 2 つのコンテンツコンポーネントを示しています。
    12. [更新] をクリックします。

    タスクの結果

    作成した完成したワードコーパスがワードコーパスフォームに表示されます。

    [更新] をクリックすると、コーパス作成プロセスを完了するためのコンポーネントの追加が検証されます。