類似性ソリューションの作成とトレーニング

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:6分
  • 機械学習ソリューションを作成およびトレーニングして、既存のレコードを新しい類似のレコードに収集して比較します。たとえば、オープンインシデントレコード内のテキストを解決済みインシデントレコードと比較して、その解決方法を再利用できます。

    始める前に

    • 必要なロール:ml_admin または admin
    重要:
    Yokohamaリリースでは、分類、クラスタリング、および類似性フレームワークのモデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、それらはワークフローソリューションになり、[ワードコーパス] フィールドはフォームから削除されます。

    このタスクについて

    システムでは、事前トレーニング済みでワードコーパスを作成する必要のないワークフロー類似性ソリューションを使用します。類似性に基づいて既存のレコードを比較した後、ソリューションで確認および再利用できる例が推奨されます。

    暗号化されたトレーニングデータの使用については、「 予測インテリジェンスでのデータ暗号化」を参照してください。

    この手順例では、インシデントレコードの作業を行っており、インシデントの解決策を提供できる関連するナレッジベース記事を見つけたいと考えています。

    新しい予測インテリジェンス類似性ソリューション定義のフォームビュー

    手順

    1. ソリューション定義に必要なアプリケーションスコープ内にいることを確認し、次に移動します: All (すべて) > 予測インテリジェンス > 類似性 > ソリューション定義.
    2. [類似性定義] リストで、[ 新規] を選択します。
    3. [類似性定義] フォームで、フィールドに入力します。
      フィールド
      ラベル 類似性ソリューションの一意の名前を入力します。たとえば、このユースケースでは、「 ナレッジ記事をインシデントと照合 (Match Knowledge Articles to Incidents)」と入力します。
      [Name (名前)] ラベル値を入力すると、ラベル値に基づいてシステムによって割り当てられた読み取り専用の名前がこのフィールドに自動的に入力されます。
      ワードコーパス

      従来の類似性ソリューションを使用している場合は、定義フォームの [ワードコーパス ] フィールドから関連するワードコーパスを選択できます。

      注:
      Washington DC リリース以降は、代わりに事前トレーニング済みモデルが使用されるため、ワードコーパスは必要ありません。[ ワードコーパス ] フィールドは、事前トレーニング済みモデルの定義フォームには表示されません。

      詳細については、「ワードコーパスの作成」を参照してください。

      テーブル

      [テーブル] フィールドで、情報源として使用するレコードを含むテーブルを選択します。このユースケースでは、 ナレッジ [kb_knowledge] テーブルを選択します。これは、その KB 記事レコードが、解決しようとしているインシデントに関連する情報を提供する可能性があるためです。

      テーブルをアサインすると、フィルター条件に一致するレコードの数がリンクとして表示されます。レコードリストを表示するには、このリンクを選択します。

      テストテーブル
      [テストテーブル] フィールドで、ターゲットとするレコードを含むテーブルを選択します。このユースケースでは、解決しようとしているインシデントレコードを含む [インシデント [incident]] テーブルを選択します。
      注:
      [テーブル] と [テストテーブル] に同じテーブルを選択できます。たとえば、フィルター条件を使用すると、最近のインシデントから情報を収集して、ターゲットインシデントに役立てることができます。
      フィールド
      選択したテーブルについて、解決しようとしているインシデントに関連する単語やフレーズが含まれている可能性が高いフィールドに入力します。この例では、[ 簡単な説明 ] と [記事本文] を選択します。記事本文を含めることで、主題に関する有益な詳細をキャプチャできる可能性が高くなります。
      注:
      [ジャーナルタイプ] は、サポートされているデータタイプではありません。
      テストフィールド

      選択したテストテーブルについて、他の類似レコードと比較するテキストを含むフィールドに入力します。この例では、解決しようとしているインシデントレコードの 簡単な説明 を選択します。

      フィルター

      [ フィルター条件の追加 ] を選択して、情報ソースとして使用しているフィールドレコードに条件を適用します。 たとえば、このユースケースでは、公開された KB 記事のみを取得するように workflow_state=published 条件を設定できます。

      注:
      スクリプトインクルードをフィルターから参照することはできません。代替手段としてデータベースビューを使用します。
      処理言語 トレーニングするデータセットの主要言語を選択します。また、デフォルトでは、すべてのデータセットに英語の処理が適用されます。たとえば、イタリア語を選択した場合、システムはイタリア語と英語の両方でデータを処理します。
      注:
      「処理」という用語は、単語のトークン化、ストップワードの削除、語幹の解釈など、ソリューションのトレーニングの一環として使用される言語固有の手順の一部を示します。
      ストップワード 処理言語を選択すると、その言語のストップワードリストが自動的に追加されます。たとえば、処理言語がイタリア語の場合、[デフォルトのイタリア語のストップワード (Default Italian Stopwords)] リストが表示されます。デフォルトの英語のストップワードリストも含まれています。

      カスタムストップワードリストを使用するには、ロックアイコン ( ロックアイコン) を選択し、[ ターゲットレコードを選択 ] フィールドで検索します。

      トレーニング頻度 再トレーニング頻度を選択します。使用可能なオプションの範囲は、[ 1 回実行 ] から [180 日ごと] までです。
      更新頻度 類似結果を取得するために使用するデータをリフレッシュする頻度を選択します。

      たとえば、新しいインシデントは通常 1 日を通して頻繁に発生するため、オープンインシデントレコードの場合、更新頻度として [15 分ごと] を選択できます。この頻度によって、新たにオープンされたレコードが更新の対象になる可能性が高まります。

      ただし、通常は頻繁に作成されない KB ナレッジ記事レコードの場合は、[ 1 日ごと] などの頻度の低い更新頻度を選択できます。
      注:
      ML スケジューラーは、インスタンスがコミットできるトレーニングの数を、24 時間枠でインスタンスあたり 50 件の新規 ML トレーニング要求に制限します。これにより、スケジュール済みの再トレーニング要求は除外されます。さらに、新規トレーニング要求が 24 時間枠内で 50 件を超えた場合でも、クラスタリングと類似性の更新もこの制限から除外されます。
    4. ソリューション定義に適したボタンを選択します。
      オプション説明
      保存 後で戻ることができるように、ソリューション定義レコードを保存します。
      送信 & トレーニング ソリューション定義レコードを作成して、それをトレーニングします。
    5. トレーニング用にソリューションを送信した場合は、[トレーニングのアクティブ化] ウィンドウで [OK] を選択して確定します。

    タスクの結果

    • 最寄りのトレーニングサービスで処理するソリューション定義がスケジュールされ、トレーニングが完了すると通知が送信されます。通知には、トレーニング中に発生した可能性のあるすべてのエラーが含まれています。他のユーザーは、予測インテリジェンス 通知カテゴリに登録できます。
    • トレーニングされたソリューションによって [ソリューション定義] フォームが更新され、類似度によってランク付けされたソリューション例のペアが提供されます。
    • トレーニングが完了すると、ソリューションは添付ファイルレコードとしてアップロードされます。

    次のタスク

    ソリューション定義フォームの [関連リンク] セクションで、トレーニング済み類似ソリューションの例を確認します。「ソリューションの類似例を確認する」を参照してください。