の構成のヒント 予測インテリジェンス

  • リリースバージョン: Xanadu
  • 更新日 2024年07月31日
  • 所要時間:5分
  • ソリューショントレーニングとソリューション予測中に問題が発生した場合は、次の推奨される解決策に従ってください。

    入力データ

    モデルのトレーニングに使用するレコードは少なくとも 30,000 件にすることをお勧めしますが、モデルの精度は入力データによって決まります。

    ソリューションのトレーニングに使用される入力データの品質を決定する主な要因は 3 つあります。

    • 清浄度: サニタイズされたデータはノイズを低減し、モデルの精度を高めます。
    • 品質: 正確な予測を行うようにモデルをトレーニングするには、入力と出力が有効かつ正確である必要があります。
    • 分布: データセット全体を表すデータは、より一般化された予測を行うことができるモデルになります。

    ほとんどの生データセットには、ダーティデータや使用できないデータが含まれています。トレーニングの前に入力セットを確認することは、正確な予測モデルを維持する上で不可欠です。

    入力データの約 80% をモデルのトレーニングに使用し、データの約 20% をモデルの正確性の評価に使用することをお勧めします。モデルの予測結果を、残りのデータの 20% の実際の値と比較できます。

    ソリューショントレーニング

    問題 解決策または提案されたアクション
    スケジューラージョブが誤った Glide コールバックインスタンス URL を使用しているため、ソリューショントレーニングが [トレーニングを待機中] ステータスのままになる時間が長すぎます。 Glide インスタンスの glide.servlet.uri プロパティが正しいインスタンス URL に設定されていることを確認します。この問題は、次の場合に発生する可能性があります。
    • インスタンスは本番環境からクローンされますが、引き続き glide.servlet.uri プロパティの本番 URL を参照します。
    • Glide インスタンスがプロビジョニングされ、トレーニングが初めて実行されます。
    新しいカテゴリが追加されましたが、まだトレーニングには影響していません。 ソリューションが再トレーニングされるまで、新しいカテゴリにはまだ十分なデータがない可能性があるため、これは想定される動作です。
    ソリューション トレーニングは失敗します。

    トレーニングが失敗した場合は、ソリューション画面の [ トレーニング進捗状況の表示] 関連リンクをクリックして、潜在的な問題がどこにあるかを判断します。

    ユーザー認証が原因でソリューショントレーニングが失敗します。 [System Security] > [Users] に移動し、sharedservice.worker ユーザーが [Active] に設定されていることを確認します。
    モデルトレーニングが返され、モデルを作成できないと表示されます。トレーニングは失敗し、「トレーニングソリューション中にエラーが発生しました」というメッセージが表示されます。トレーニングの進行状況ウィンドウに、「使用されたデータが十分でないか、入力フィールドが出力フィールドを予測していないため、ソリューションのトレーニングに失敗しました」というメッセージが表示されます。 この問題は、データ量またはフィールド値の分布が、モデルを正常に構築するのに十分でない場合に発生する可能性があります。次の手順に従ってトラブルシューティングを行います。
    1. 出力フィールドの分布が歪んでいないことを確認します。
    2. 大量のデータを使用するように日付フィルターを変更して、モデルを再トレーニングします。
    3. 入力フィールドに値が完全に入力されていない場合は、null レコードを削除するフィルターを追加します。
    ソリューションには複数の言語のデータがありますが、カバレッジと精度の結果は不十分です。

    メトリクスを改善するには、次のオプションを使用します。

    オプション 1:ソリューションの処理言語を英語以外の最も目立つ言語に更新します。
    注:
    デフォルトでは、すべてのデータセットに英語が適用されます。
    オプション 2: 各言語/地域に十分なデータがある場合:
    1. プライマリ言語を識別できる特定の言語/地域 (オランダ語、英語、フランス語、ドイツ語、日本語、スペイン語) のフィルター条件を追加します。
    2. 言語/地域ごとにソリューションを生成し、各ソリューションに適切な処理言語を適用します。

    ソリューション予測

    問題 解決策または提案されたアクション
    予測は失敗し、原因が不明な Java 例外が返されます。
    1. 予測インテリジェンス Glide ログで例外を検索します。
    2. 例外、影響を受けるインスタンス、ソリューション名、入力文字列など、関連するすべての詳細を含む 予測インテリジェンス のインシデントレコードを送信します。
    インシデント/ケースレコードに適用される予測はありませんが、REST API Explorer でテストすると予測が値を返します。 これは、予測の信頼性が予測に必要なしきい値よりも低い場合に発生する可能性があります。ソリューションがトレーニングされたら、次の手順を使用して、ソリューション設定を調整する必要があるかどうかを確認します。
    1. [System Web Services > REST > REST API Explorer (REST API エクスプローラー)] に移動して、予測の信頼性レベルを確認します。「分類のソリューション予測のテスト」を参照してください。
    2. ML ソリューション定義レコードで、クラスの名前をクリックして、予測で返された結果クラスに設定されたしきい値を確認します。[クラス] ページが表示されます。
    3. [推定精度] と [推定カバレッジ] の値を確認します。対応するしきい値が結果の予測の信頼度を超えている場合、これが予測が表示されなかった根本原因です。
    4. クラスの精度とカバレッジの値を調整して、カバレッジまたは精度を上げます。「トレーニング済みの分類ソリューションの調整」を参照してください。

    インスタンスのクローン作成

    問題 解決策または提案されたアクション
    インスタンスがクローンされると、既存のソリューションの予測は失敗します。 [ml_artifacts] テーブル内の ML ソリューションアーティファクトは、[sys_attachment table] に格納されます。実行時に [ml_artifacts] テーブルがクローンに含まれていない場合、予測は失敗します。機械学習アーティファクトは 予測インテリジェンス ソリューションの重要なコンポーネントであるため、クローンにこれらが含まれていることを確認します。
    インスタンスがクローンされると、ソリューショントレーニングは失敗します。 クローン作成の実行が進むにつれて、sharedservice.worker ユーザーが非アクティブ化されているか、ロックアウトされているか、ユーザー ID が設定されていない可能性があります。これらの問題を解決して、ソリューショントレーニングを成功させます。