ワードコーパスの作成
システムがテキストの類似性に基づいてインスタンスレコードを比較するために使用される語彙として機能する単語やフレーズのコレクションを構築します。ワードコーパスは、機械学習システムに理解させたい辞書と考えることができます。
始める前に
このタスクについて
重要:
ワードコーパスの主な目的は、モデルをトレーニングするためのテキストデータを推測することです NLU 。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズでのトレーニング用にワードコーパスを指定する必要があります。トレーニング済みのワードコーパスは、ソリューションや機能全体で再利用できます。Washington DCこのリリースでは、クラスタリングモデルと類似性モデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、ワークフローソリューションになり、[ワードコーパス] フィールドがフォームから削除されます。
従来のコンテキストでは、次の情報が提供されています。
ワードコーパスを使用すると、1 つのテーブル内または複数のテーブル間で類似したレコードテキストを比較できます。ワードコーパスは、データ分析、再利用、またはレビューのために類似レコードをグループ化するクラスタリングなどの他のシナリオでも役立ちます。コーパスに追加する項目は、他の類似性ソリューションやクラスタリングソリューションで再利用してさまざまなユースケースに適用できるように、会社および業界に固有のものにする必要があります。
この手順例では、インシデントレコードを操作していて、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を見つけたいと考えています。ここでの目標は、アクティブなインシデントと公開された KB 記事を比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。