分類ソリューションの作成とトレーニング

  • リリースバージョン: Washingtondc
  • 更新日 2024年02月01日
  • 1 読むのに数分読む
  • 分類ソリューションのトレーニングに使用するレコード、予測をトリガーするフィールド、およびソリューションを再トレーニングする頻度を指定します。

    始める前に

    • カスタムストップワードリストを作成します。
    • 必要なロール:admin または ml_admin

    このタスクについて

    予測インテリジェンス は、ソースデータがこれらのタイプの暗号化で保護されるトレーニングソリューションをサポートします。
    • FDE (フルディスク暗号化)
    • Column Level Encryption。Column Level Encryption を使用する場合は、 sharedservice.worker ユーザーに、暗号化に使用されたものと同じ暗号化モジュールロールがあることを確認してください。
    注:
    予測インテリジェンス は、Edge Encryption でソースデータが暗号化されるトレーニングソリューションをサポートしません。

    予測モデルの品質は、そのトレーニングに使用するデータによって決まります。適切なトレーニングレコードを選択するには、テーブルデータベースディクショナリーと、使用するレコード値の現在の品質について理解する必要があります。

    サポートする予測モデルごとに個別のソリューション定義レコードを作成する必要があります。コンテキストメニューから [ソリューション定義をコピー] をクリックすると、ソリューション定義レコードとその構成を新しいフォームにコピーできます。新しいレコードを使用して、ソリューション定義全体を再構成することなく、さらにソリューションを更新できます。

    注:
    トレーニングデータセット内のレコード数が 30 未満のクラスは、ソリューショントレーニングから除外されます。ソリューションがトレーニングされて完了すると、除外されたクラスが ML ソリューションフォームの [ソリューション統計情報] セクションに一覧表示されます。

    ソリューショントレーニングから除外されたクラスは、トレーニング済みソリューションの ML ソリューションフォームの [ソリューション統計情報] セクションに一覧表示されます。

    手順

    1. 移動先 すべて > 予測インテリジェンス > 分類 > ソリューション定義.
    2. [分類定義] リストで、[ 新規] をクリックします。
    3. 空の [分類定義] フォームで、次のガイダンスに従ってこれらのフィールドを構成します。
      フィールド
      ラベル ソリューションレコードの一意の名前を入力します。
      名前 入力した [ラベル] 値に基づいて、この読み取り専用フィールドの値が生成されます。
      ワードコーパス

      ソリューションに関連する既存のワードコーパスを選択します。たとえば、このユースケースでは、「 過去 3 か月間のインシデント」などのタイトルを持つワードコーパスを選択します。

      関連するワードコーパスがない場合は、まず手順に従って ワードコーパスを作成します 。ワードコーパスが完成したら、[分類定義] フォームの [ワードコーパス] フィールドから選択できます。

      注:
      [ワードコーパス] は、Utah 以降初めて実装 予測インテリジェンス する顧客にとって必須フィールドではありません。代わりに、事前トレーニング済みのモデルが使用されます。
      テーブル システムで予測するターゲットレコードを含むテーブルを選択します。
      出力フィールド

      予測モデルで値を設定するフィールドを選択します。

      一般に、適切な出力フィールドには次のような特徴があります。
      • これは、選択フィールド、または可能な値の有限セットを含む文字列フィールドです。
      • 入力フィールドと何らかの因果関係があります。

      たとえば、デフォルトの インシデント分類 ソリューション定義では、[ カテゴリ ] フィールドを出力フィールドとして使用します。

      フィールド

      予測を生成するためにソリューションで使用する入力フィールドを選択します。

      入力フィールドは、予測ソリューションが成功するために必要な分類情報を含む可能性があるレコード内のフィールドです。たとえば、インシデントレコードをトリアージするための正しいクラスを予測する場合、その予測はクラスを参照するテキストを含むレコードを収集する必要があります。ほとんどのレコードの [簡単な説明 ] フィールドにコンテキストテキストが含まれているため、一般的に使用するのに最適な入力フィールドです。[解決メモ] を入力フィールドとして使用することもできます。これは、インシデントの詳細なメモでインシデントクラスを参照する場合があるためです。

      一般に、適切な入力フィールドには次のような特性があります。
      • これらのフィールドは、ユーザーがレコードを作成するときに使用できます。
      • フィールドのデータタイプは、文字列、参照、選択肢、または HTML です。フィールドが提供する情報が多いほど、ソリューションが予測を行う頻度が高くなり、予測が正確になる頻度が高くなります。
      • このフィールドにはデフォルト値があり、空白にすることはできません。.

      すべてのデフォルトのソリューション定義は、[ 簡単な説明 ] フィールドを使用します。

      フィルター

      [ フィルター条件の追加 ] をクリックして、トレーニングしているレコードに条件を適用します。

      たとえば、 インシデント分類 ソリューション定義では、[ 作成][日付][過去 12 か月] AND [アクティブ][次の値に等しい][false] AND [ステータス][は次の値のいずれか][解決済み |[定休日]

      ソリューションをトレーニングするには、フィルターで少なくとも 1 つのレコードを返す必要があります。フィルターでレコードが返されない場合、トレーニング用のレコードが返されるまでフィルターを更新します。
      注:
      適切なソリューションをトレーニングするために推奨されるレコードの数は 30,000~300,000 です。300,000 件以上のレコードを送信する場合は、ソリューションをトレーニングするために最新の 300,000 件のレコードが使用されます。データベースからの真正なレコードのみを使用します。
      ソリューションの良し悪しは、そのトレーニングに使用するデータにかかっています。一般に、優れたフィルターには次のような特徴があります。
      • トレーニングレコードは非アクティブで、解決済みやクローズ済みなど、標準プロセス内の作業の完了を表すタスクステータスがあります。
      • トレーニングレコードには、ターゲットフィールドの正しい値のみが含まれています。信頼性の低いターゲットフィールド値を含むレコードを除外します。たとえば、アサイン先グループ/カテゴリを予測していて、使用されなくなったアサイン先グループ/カテゴリが履歴インシデントデータにある場合は、そのようなインシデントレコードをトレーニングから削除するフィルターを追加します。
      • トレーニングレコードには、ソリューションで予測する各ターゲットフィールド値の複数の例が含まれています。
      • トレーニングレコードには、入力フィールドの一般的なバリエーションが含まれています。

      ハードコードされた日付をフィルターとして使用しないでください。これらのフィルターは、すべての再トレーニングの前に手動で更新しない限り、ソリューションの再トレーニング時に更新されないためです。代わりに、過去 3 か月、過去 6 か月、過去 12 か月などの相対日付フィルターを使用してください。

      処理言語 ソリューション定義でトレーニングしているデータセットの主要言語を選択します。データセットの言語がイタリア語の場合は、[イタリア語] を選択します。また、デフォルトでは、すべてのデータセットに英語の処理が適用されます。たとえば、イタリア語を選択した場合、システムは英語とイタリア語の両方でデータを処理します。
      注:
      「処理」という用語は、ソリューションのトレーニングの一環として使用される言語固有の手順の一部を示します。たとえば、単語のトークン化、ストップワードの削除、語幹の解釈などがあります。
      ストップワード 処理言語を選択した場合、システムは同じ言語を使用しているストップワードリストを自動的に追加します。たとえば、処理言語がイタリア語の場合、[デフォルトのイタリア語のストップワード (Default Italian Stopwords)] リストが表示されます。選択すると、[ デフォルトの英語のストップワード (Default English Stopwords )] リストも表示されます。カスタムストップワードリストを作成する場合は、[ストップワード] フィールドから選択して、それをソリューションに追加します。
      トレーニング頻度
      [フィルター] と一致するレコードに基づいて、システムがソリューションを再生成する頻度を選択します。次の選択肢があります。
      • 1 回実行
      • 30 日ごと
      • 60 日ごと
      • 90 日ごと
      • 120 日ごと
      • 180 日ごと
      注:
      分類ソリューションのトレーニングに必要なレコードの最小数は、10,000 に設定されています。

      デフォルトでは、システムはトレーニングを 1 回実行します。このプラクティスにより、許容される範囲と精度の値が提供されるまで、必要に応じてソリューション定義をレビューして更新する時間が与えられます。

      ソリューション定義がかなり安定している場合は、データが時間の経過とともに古くなり、予測モデルの精度が低下する可能性があるため、スケジュール設定済みのトレーニングを検討してください。

      注:
      ML スケジューラーは、インスタンスがコミットできるトレーニングの数を、24 時間枠でインスタンスあたり 50 件の新規 ML トレーニング要求に制限します。この制限では、新しいトレーニング要求が 24 時間枠内で 50 件を超えた場合でも、スケジュールされた再トレーニング要求、クラスタリングの更新、および類似性の更新は除外されます。
    4. ソリューション定義に該当するコンテキストメニューのオプションまたはボタンをクリックします。
      オプション説明
      [保存] または [保存してトレーニング] ソリューション定義レコードを保存して、後でそれに戻ることができるようにするか、または保存して、それをトレーニング用に送信します。
      [送信] または [送信してトレーニング] ソリューション定義レコードを作成して、それを送信するか、または送信してトレーニングします。
    5. トレーニング用にソリューションを送信した場合は、[トレーニングのアクティブ化] ウィンドウで [OK] をクリックして確定します。
      • システムは、最寄りのトレーニングサービスでトレーニングを受けるようにソリューションをスケジュールします。トレーニングが完了すると、それを知らせる通知が送信されます。トレーニング中にエラーが発生した場合には、そのエラーも通知に記載されます。他のユーザーは、予測インテリジェンス通知カテゴリに登録できます。トレーニングが完了すると、ソリューションは添付ファイルレコードとしてアップロードされます。
      • バブルチャートがソリューションフォームの [ソリューションの表示方法] タブに入力され、ソリューションの対象となる各クラスの推定精度と推定カバー範囲が表示されます。バブルのサイズは、クラスに属するレコードのパーセンテージ (分布) を示します。バブルをポイントすると、その推定カバー範囲、推定精度、および分布を確認できます。
      ソリューションの対象となる各クラスの推定精度とカバー範囲。

    次のタスク

    ソリューションの [解の統計量] タブの [クラスの信頼性] セクションで、学習済みの解の精度と範囲の統計量を確認します。

    ソリューションの [ソリューションをテスト] タブで、[簡単な説明] などの入力フィールドに値を入力して、予測出力をテストできます。

    簡単な説明などの入力フィールドに値を入力して、予測への入力として使用したレコードの予測出力をテストする方法