ワードコーパスの作成

ワシントン DC で AI を有効にする

Release

washingtondc

ft:locale

ja-JP

ft:publication_title

ワシントン DC で AI を有効にする

ft:clusterId

platai

bundleId

platai

workflow

Platform

ワードコーパスの作成

リリースバージョン: Washingtondc

更新日 2024年02月01日

1 読むのに数分読む

システムがテキストの類似性に基づいてインスタンスレコードを比較するために使用される語彙として機能する単語やフレーズのコレクションを構築します。ワードコーパスは、機械学習システムに理解させたい辞書と考えることができます。

始める前に

必要なロール:ml_admin または admin

このタスクについて

重要:

Washington DCこのリリースでは、クラスタリングモデルと類似性モデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、ワークフローソリューションになり、[ワードコーパス] フィールドがフォームから削除されます。

従来のコンテキストでは、次の情報が提供されています。

ワードコーパスの主な目的は、モデルをトレーニングするためのテキストデータを推測することです NLU 。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズでのトレーニング用にワードコーパスを指定する必要があります。トレーニング済みのワードコーパスは、ソリューションや機能全体で再利用できます。

ワードコーパスを使用すると、1 つのテーブル内または複数のテーブル間で類似したレコードテキストを比較できます。ワードコーパスは、データ分析、再利用、またはレビューのために類似レコードをグループ化するクラスタリングなどの他のシナリオでも役立ちます。コーパスに追加する項目は、他の類似性ソリューションやクラスタリングソリューションで再利用してさまざまなユースケースに適用できるように、会社および業界に固有のものにする必要があります。

この手順例では、インシデントレコードを操作していて、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を見つけたいと考えています。ここでの目標は、アクティブなインシデントと公開された KB 記事を比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。

手順

移動先すべて > 予測インテリジェンス > ワードコーパス.
[ワードコーパス] フォームで、[ 新規] をクリックします。

次のガイダンスに従って、これらのフィールドを構成します。


フィールド	説明
名前	コーパスのコンテンツを参照する一意のタイトル。たとえば、このユースケースでは、「 `アクティブなインシデント」や「公開された KB」`などの名前を入力できます。名前は、ソリューションの作成に役立つコーパスでマイニングされるテーブルを示しているためです。
アクティブ	一度に複数のワードコーパスを作成し、後で詳細コンポーネントを設定する予定の場合は、このチェックボックスをオンにします。それ以外の場合は、後の手順で選択できるため、空白のままにします。

[Submit (送信)] をクリックします。
[ワードコーパス] リストビューで、新しいワードコーパスを見つけてその [名前 ] 値をクリックし、レコードを開きます。
[ワードコーパスのコンテンツ] セクションで、[ 新規] をクリックします。

[ワードコーパスコンテンツ] フォームで、次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスのコンテンツコンポーネントを定義します。


フィールド	説明
名前	コーパスに追加するデータを参照するタイトル ( `過去 6 か月間にクローズされたインシデント`など) を入力します。
テーブル	ワードコーパスに含めるデータを含むテーブルを選択します。このユースケースでは、インシデント [incident] を選択します。注: 類似性およびクラスタリングソリューションで使用されるワードコーパスを作成するためのテーブルごとのレコード数は 30 万件に制限されています。
フィルター	フィルター条件値として、[クローズ済み ]、[は空でない]、および [過去 6 か月間に作成] を選択します。
フィールドリスト	このユースケースでは、[ 簡単な説明]、[ 説明]、および [解決メモ] を選択します。
ドメイン	コーパスのユーザーグループが自動的に表示されます。たとえば、このユースケースでは、グローバルユーザーグループが表示されます。他のユーザーグループも選択できます。

[Submit (送信)] をクリックします。
[ワードコーパスの詳細] セクションで、[ 新規] をクリックします。

ワードコーパスの 2 番目のコンテンツコンポーネントを定義するには、以下のガイダンスに従ってこれらのフィールドを設定します。


フィールド	説明
名前	最初のコンテンツコンポーネントと比較するデータを参照するタイトル ( `「公開された KB 記事`」など) を入力します。
テーブル	最初のコンテンツコンポーネントと比較するデータを含むテーブルを選択します。このユースケースでは、[ ナレッジ [kb_knowledge] を選択します。注: 類似性およびクラスタリングソリューションで使用されるワードコーパスを作成するためのテーブルごとのレコード数は、テーブルあたり 30 万レコードに制限されています。
フィルター	フィルター条件の [Workflow] [is] [Published] から選択します。
フィールドリスト	[ Short description (簡単な説明)] と [ Article body (記事の本文)] を選択します。

[Submit (送信)] をクリックします。

2 つのワードコーパスコンテンツコンポーネントがワードコーパスフォームに表示されます。
[Update (更新)] をクリックします。

タスクの結果

作成した完成したワードコーパスがワードコーパスフォームに表示されます。

[更新] をクリックすると、コンポーネントの追加が検証され、コーパス作成プロセスが完了します。