分類ソリューションの作成とトレーニング

  • リリースバージョン: Xanadu
  • 更新日 2024年07月30日
  • 所要時間:8分
  • 分類ソリューションのトレーニングに使用するレコード、予測をトリガーするフィールド、およびソリューションを再トレーニングする頻度を指定します。

    始める前に

    このタスクについて

    予測モデルの品質は、トレーニングに使用するデータによって決まります。トレーニングに適したレコードを選択するには、テーブルのデータベースディクショナリと、使用するレコード値の現在の品質を調べます。

    暗号化されたトレーニング データの使用については、「 予測インテリジェンスのデータ暗号化」を参照してください。

    トレーニングに使用できるレコードの最小数と最大数については、「 予測インテリジェンスのプロパティ」を参照してください。

    注:
    トレーニングデータセット内のレコード数が 30 未満のクラスは、ソリューショントレーニングから除外されます。ソリューションがトレーニングされて完了すると、除外されたクラスが ML ソリューションフォームの [ソリューション統計情報] セクションに一覧表示されます。

    ソリューショントレーニングから除外されたクラスは、トレーニング済みソリューションの ML ソリューションフォームの [ソリューション統計情報] セクションに一覧表示されます。

    サポートする予測モデルごとに個別のソリューション定義を作成する必要があります。次の手順では、新しい分類ソリューションを作成する方法について説明しますが、コンテキストメニューから [ ソリューション定義をコピー ] を選択して、既存のソリューション定義とその構成を新しいレコードにコピーすることもできます。必要に応じて、新しいレコードのフィールド値を編集します。

    手順

    1. ソリューション定義に必要なアプリケーションスコープ内にいることを確認してから、 すべて > 予測インテリジェンス > 分類 > ソリューション定義.
    2. [分類定義] リストで、[ 新規] を選択します。
    3. 空の [分類定義] フォームで、次のガイダンスに従ってフィールドを設定します。
      フィールド
      ラベル ソリューションレコードの一意の名前を入力します。
      名前 入力した [ラベル] 値に基づいて、この読み取り専用フィールドの値が生成されます。
      ワードコーパス

      ソリューションに関連するワードコーパスを選択します。詳細については、「ワードコーパスの作成」を参照してください。

      注:
      [ワードコーパス] は、Utah 年に初めて 予測インテリジェンス を実装する顧客にとって必須フィールドではありません。代わりに、事前トレーニング済みモデルが使用されます。事前トレーニング済みモデルの [ワードコーパス] フィールドは削除されます。
      テーブル システムで予測するターゲットレコードを含むテーブルを選択します。
      出力フィールド

      予測モデルで値を設定するフィールドを選択します。

      一般に、適切な出力フィールドには次のような特性があります。
      • これは、有限の可能な値のセットを含む選択フィールドまたは文字列フィールドです。
      • 入力フィールドと何らかの因果関係があります。

      たとえば、デフォルトの インシデント分類 ソリューション定義では、出力フィールドは [カテゴリ] に設定されます。

      フィールド

      ソリューションで予測を生成するために使用する入力フィールドを選択します。

      入力フィールドは、予測ソリューションを成功させるために必要な分類情報が含まれている可能性があるレコード内のフィールドです。たとえば、インシデントレコードをトリアージするための正しいクラスを予測する場合、その予測では、そのクラスを参照するテキストを含むレコードが収集される必要があります。ほとんどのレコードの [Short description (簡単な説明 )] 項目にはコンテキストテキストがあるため、一般的に使用するのに最適な入力項目です。[解決メモ] を入力フィールドとして使用することもできます。解決メモも、インシデントの詳細メモでインシデントクラスを参照する場合があるためです。

      一般に、適切な入力フィールドには次の特性があります。
      • これらのフィールドは、ユーザーがレコードを作成するときに使用できます。
      • フィールドのデータタイプは、文字列、参照、選択肢、または HTML です。フィールドが提供する情報が多ければ多いほど、ソリューションで予測できる頻度が高くなり、予測が正確になる頻度も高くなります。
      • このフィールドにはデフォルト値があり、空白にすることはできません。

      すべてのデフォルトのソリューション定義は、[ 簡単な説明 ] フィールドを使用します。

      フィルター

      [ フィルター条件の追加 ] をクリックして、トレーニングしているレコードに条件を適用します。

      たとえば、 インシデント分類 ソリューション定義では、次の条件でフィルターを使用します: [作成済み][日付][過去 12 か月] AND [アクティブ][次の値に等しい][false] かつ [ステータス][は次のいずれか][解決済み |[クローズ済み]

      ソリューションをトレーニングするには、フィルターで少なくとも 1 つのレコードを返す必要があります。フィルターでレコードが返されない場合、トレーニング用のレコードが返されるまでフィルターを更新します。
      注:
      適切なソリューションをトレーニングするために推奨されるレコードの数は 30,000~300,000 です。300,000 件以上のレコードを送信する場合は、ソリューションをトレーニングするために最新の 300,000 件のレコードが使用されます。データベースからの真正なレコードのみを使用します。
      一般に、優れたフィルターにはこれらの特性があります。
      • トレーニングレコードは非アクティブで、そのステータスは、解決済みやクローズ済みなど、標準プロセス内で完了した作業を示します。
      • ターゲットフィールドには正しい値のみが含まれています。信頼性の低いターゲットフィールド値を持つレコードを除外します。たとえば、アサイン先グループ/カテゴリを予測していて、履歴インシデントデータに使用されなくなったアサイン先グループ/カテゴリが含まれている場合は、フィルターを追加して、そのようなレコードをトレーニングから削除します。
      • トレーニングレコードには、ソリューションで予測する各ターゲットフィールド値の複数の例が含まれています。
      • トレーニングレコードには、入力フィールドの一般的なバリエーションが含まれています。

      過去 3 か月や過去 12 か月などの相対日付フィルターを使用します。これらのフィルターは、手動で更新しない限り、ソリューションの再トレーニング時に更新されないため、ハードコードされた日付は使用しないでください。

      処理言語 ソリューション定義でトレーニングしているデータセットの主要言語を選択します。データセットの言語がイタリア語の場合は、[イタリア語] を選択します。また、デフォルトでは、すべてのデータセットに英語の処理が適用されます。たとえば、イタリア語を選択した場合、システムは英語とイタリア語の両方でデータを処理します。
      注:
      「処理」という用語は、ソリューションのトレーニングの一環として使用される言語固有の手順の一部を示します。たとえば、単語のトークン化、ストップワードの削除、語幹の解釈などがあります。
      ストップワード 処理言語を選択すると、その言語のストップワードリストが自動的に追加されます。たとえば、処理言語がイタリア語の場合、[デフォルトのイタリア語のストップワード (Default Italian Stopwords)] リストが表示されます。デフォルトの英語ストップワードリストも含まれています。カスタムストップワードリストを作成する場合は、[ストップワード] フィールドから選択してソリューションに追加できます。
      トレーニング頻度
      システムがソリューションを再生成する頻度を選択します。使用可能なオプションの範囲は、[ 1 回実行 ] から [180 日ごと] までです。
      注:
      分類ソリューションのトレーニングに必要なレコードの最小数は 10,000 に設定されています。

      デフォルトでは、システムはトレーニングを 1 回実行します。これにより、許容可能な範囲と精度の値が提供されるまで、ソリューション定義をレビューして更新する時間が確保できます。

      ソリューション定義がかなり安定している場合は、データが時間の経過とともに古くなり、予測モデルの精度が低下する可能性があるため、スケジュールされたトレーニングを検討してください。

      注:
      ML スケジューラーは、インスタンスがコミットできるトレーニングの数を、24 時間枠でインスタンスあたり 50 件の新規 ML トレーニング要求に制限します。この制限では、新しいトレーニング要求が 24 時間以内に 50 件を超えた場合でも、スケジュールされた再トレーニング要求、クラスタリングの更新、および類似性の更新は除外されます。
    4. ソリューション定義に該当するコンテキストメニューのオプションまたはボタンをクリックします。
      オプション説明
      [保存] または [保存してトレーニング] ソリューション定義レコードを保存して、後でそれに戻ることができるようにするか、または保存して、それをトレーニング用に送信します。
      [送信] または [送信してトレーニング] ソリューション定義レコードを作成して、それを送信するか、または送信してトレーニングします。
    5. トレーニング用にソリューションを送信した場合は、[トレーニングのアクティブ化] ウィンドウで [OK] をクリックして確定します。
      • システムは、最寄りのトレーニングサービスでトレーニングを受けるようにソリューションをスケジュールします。トレーニングが完了すると、それを知らせる通知が送信されます。トレーニング中にエラーが発生した場合には、そのエラーも通知に記載されます。他のユーザーは、予測インテリジェンス 通知カテゴリに登録できます。トレーニングが完了すると、ソリューションは添付ファイルレコードとしてアップロードされます。
      • バブルチャートがソリューションフォームの [ソリューションの可視化] タブに入力され、ソリューションの対象となる各クラスの推定精度とカバー範囲が表示されます。バブルのサイズは、クラスに属するレコード (分布) の割合を示します。バブルをポイントすると、その推定カバレッジ、推定精度、および分布を確認できます。
      ソリューションの対象となる各クラスの推定精度とカバー範囲。

    次のタスク

    ソリューションの [解の統計量] タブの [クラスの信頼性] セクションで、学習済みの解の精度とカバレッジの統計量を確認します。

    ソリューションの [ソリューションをテスト] タブで、[簡単な説明] などの入力フィールドから値を入力して、予測出力をテストできます。

    簡単な説明などの入力フィールドに値を入力して、予測への入力として使用したレコードの予測出力をテストする方法