類似性ソリューションの作成とトレーニング

  • リリースバージョン: Xanadu
  • 更新日 2024年08月16日
  • 所要時間:6分
  • 機械学習ソリューションを作成およびトレーニングして、既存のレコードを新しい類似のレコードに収集して比較します。たとえば、オープンインシデントレコード内のテキストを解決済みインシデントレコードと比較して、その解決方法を再利用できます。

    始める前に

    • 必要なロール:ml_admin または admin
    重要:
    Washington DC リリース以降、クラスタリングモデルと類似性モデルはワークフローソリューションを使用します。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、ワークフローソリューションになり、[ワードコーパス] フィールドがフォームから削除されます。

    このタスクについて

    システムは、事前にトレーニングされたワークフロー類似性ソリューションを使用し、ワードコーパスを構築する必要はありません。類似性に基づいて既存のレコードを比較した後、ソリューションで確認して再利用できる例が推奨されます。

    暗号化されたトレーニング データの使用については、「 予測インテリジェンスのデータ暗号化」を参照してください。

    この手順例では、インシデントレコードの作業を行っており、インシデントの解決策を提供できる関連するナレッジベース記事を見つけたいと考えています。

    新しい予測インテリジェンス類似性ソリューション定義のフォームビュー

    手順

    1. ソリューション定義に必要なアプリケーションスコープ内にいることを確認してから、 すべて > 予測インテリジェンス > 類似性 > ソリューション定義.
    2. [類似性定義] リストで [新規] を選択します。
    3. [類似性定義] フォームで、フィールドに入力します。
      フィールド
      ラベル 類似性ソリューションの一意の名前を入力します。たとえば、このユースケースでは、「 ナレッジ記事をインシデントに一致させる」と入力できます。
      名前 ラベル値を入力すると、このフィールドには、ラベル値に基づいてシステムが割り当てた読み取り専用の名前が自動的に入力されます。
      ワードコーパス

      従来の類似性ソリューションがある場合は、定義フォームの [ワードコーパス ] フィールドから関連するワードコーパスを選択できます。

      注:
      Washington DC リリース以降では、事前トレーニング済みモデルが代わりに使用されるため、ワードコーパスは必要ありません。[ワードコーパス] フィールドは、事前トレーニング済みモデルの定義フォームには表示されません。

      詳細については、「ワードコーパスの作成」を参照してください。

      テーブル

      [テーブル] フィールドで、情報ソースとして使用するレコードを含むテーブルを選択します。このユースケースでは、 ナレッジ [kb_knowledge] テーブルを選択します。その KB 記事レコードから、解決しようとしているインシデントに関連する情報が提供される可能性があるためです。

      テーブルを割り当てると、フィルター条件に一致するレコードの数がリンクとして表示されます。レコードのリストを表示するには、このリンクを選択します。

      テストテーブル
      [テストテーブル] フィールドで、ターゲットとするレコードを含むテーブルを選択します。このユースケースでは、解決しようとしているインシデントレコードを含む [インシデント [incident]] テーブルを選択します。
      注:
      [テーブル] と [テストテーブル] に同じテーブルを選択できます。たとえば、フィルター条件を使用して、ターゲットインシデントに役立つ情報を最近のインシデントから収集できます。
      フィールド
      選択したテーブルについて、解決しようとしているインシデントに関連する単語やフレーズが含まれている可能性が高いフィールドに入力します。この例では、[ Short description] と [ Article body] を選択します。記事の本文を含めると、主題に関する有益な詳細をキャプチャできる可能性が高まります。
      注:
      [ジャーナルタイプ] は、サポートされているデータタイプではありません。
      テストフィールド

      選択したテストテーブルで、他の類似したレコードと比較するテキストを含むフィールドを入力します。この例では、解決しようとしているインシデントレコードの [Short description (簡単な説明 )] を選択します。

      フィルター

      [ フィルター条件の追加 ] を選択して、情報ソースとして使用しているフィールドレコードに条件を適用します。 たとえば、このユースケースでは、公開された KB 記事のみを取得するように workflow_state=published 条件を設定できます。

      注:
      スクリプトインクルードをフィルターから参照することはできません。代替手段としてデータベースビューを使用します。
      処理言語 トレーニングするデータセットの主要言語を選択します。また、デフォルトでは、すべてのデータセットに英語の処理が適用されます。たとえば、イタリア語を選択した場合、システムはイタリア語と英語の両方でデータを処理します。
      注:
      「処理」という用語は、単語のトークン化、ストップワードの削除、語幹解釈など、ソリューションのトレーニングの一環として使用される言語固有の手順の一部を示します。
      ストップワード 処理言語を選択すると、その言語のストップワードリストが自動的に追加されます。たとえば、処理言語がイタリア語の場合、[デフォルトのイタリア語のストップワード (Default Italian Stopwords)] リストが表示されます。デフォルトの英語ストップワードリストも含まれています。

      カスタムストップワードリストを使用するには、ロックアイコン ( ) を選択し、[ ターゲットレコードを選択 ] フィールドで検索します。

      トレーニング頻度 再トレーニング頻度を選択します。使用可能なオプションの範囲は、[ 1 回実行 ] から [180 日ごと] までです。
      更新頻度 類似結果を取得するために使用するデータをリフレッシュする頻度を選択します。

      たとえば、新しいインシデントは通常 1 日を通じて頻繁に発生するため、オープンインシデントレコードの更新頻度として [15 分ごと] を選択できます。この頻度によって、新たにオープンされたレコードが更新の対象になる可能性が高まります。

      ただし、通常は頻繁に作成されない KB ナレッジ記事レコードの場合は、[ 1 日ごと] などの更新頻度を低くすることができます。
      注:
      ML スケジューラーは、インスタンスがコミットできるトレーニングの数を、24 時間枠でインスタンスあたり 50 件の新規 ML トレーニング要求に制限します。これにより、スケジュール済みの再トレーニング要求は除外されます。さらに、新規トレーニング要求が 24 時間枠内で 50 件を超えた場合でも、クラスタリングと類似性の更新もこの制限から除外されます。
    4. ソリューション定義に適したボタンを選択します。
      オプション説明
      保存 後で戻ることができるように、ソリューション定義レコードを保存します。
      送信 & トレーニング ソリューション定義レコードを作成して、それをトレーニングします。
    5. トレーニング用にソリューションを送信した場合は、 [トレーニングのアクティブ化] ウィンドウで [OK] を選択して確定します。

    タスクの結果

    • 最寄りのトレーニングサービスで処理するソリューション定義がスケジュールされ、トレーニングが完了すると通知が送信されます。通知には、トレーニング中に発生した可能性のあるすべてのエラーが含まれています。他のユーザーは、予測インテリジェンス 通知カテゴリに登録できます。
    • トレーニングされたソリューションによって [ソリューション定義] フォームが更新され、類似度によってランク付けされたソリューション例のペアが提供されます。
    • トレーニングが完了すると、ソリューションは添付ファイルレコードとしてアップロードされます。

    次のタスク

    ソリューション定義フォームの [関連リンク] セクションで、トレーニング済み類似ソリューションの例を確認します。「ソリューションの類似例を確認する」を参照してください。