回帰ソリューションの作成とトレーニング
履歴データを使用してソリューションをトレーニングし、気温や株価などの数値出力を予測します。たとえば、回帰を使用して、インシデントやケースの解決にかかる時間を見積もることができます。
始める前に
必要なロール:ml_admin または admin
このタスクについて
- 平均絶対誤差 (MAE) は、予測値と実際の値の平均偏差を測定します。この測定基準は、スケールがターゲットのスケールと同じであるため、理解しやすいため便利です。ただし、MAEは無制限であるため、モデル間で比較することは困難です。
- 対称平均絶対パーセント誤差 (SMAPE) は、予測値から実際値までの偏差のパーセンテージ値です。SMAPE は MAE の有界バージョンですが、値の範囲が 0 から 100 である点が異なります。SMAPE 値が低いほど、モデルの精度は高くなります。
- 範囲精度 は、予測された範囲間の実際の値の割合です。つまり、予測の上限と下限の間の範囲です。たとえば、5 つの実測値のうち 4 つが予測範囲内にある場合、範囲の精度は 80% です。
- 平均間隔幅 は、予測の上限と下限の差です。この測定基準は、間隔がどれほど有益であるかを説明します。平均幅が小さいほど、モデルは優れています
予測を行う場合、回帰では、予測間隔 (範囲) の信頼性レベルを指定することもできます。
この手順例では、回帰ソリューション定義を作成してトレーニングし、クラウドデータベースの復元にかかる時間を予測します。
手順
次のタスク
このシナリオ例では、ソリューション定義から ML ソリューションを作成しました。ML ソリューションの [関連リンク] セクションに、[ソリューション統計情報]、[ソリューションをテスト]、[ソリューション定義] タブが表示されます。
[ソリューション統計情報] タブで、ソリューションによって生成されたポイント推定と範囲 (予測間隔) の統計情報を確認します。
ソリューションの [ソリューションをテスト] タブで、[ ソースデータセンター]、[ ターゲットデータセンター]、[ データベースサイズ] などの入力フィールドに値を入力することで、予測への入力として使用したレコードの予測出力をテストできます。また、デフォルトの予測信頼レベルである 95 を使用するか、0 から 100 までの異なるレベルを入力することができます。値として 95 を使用することは、実際の予測が予測間隔内に収まる確度が 95% であることを意味します。[テストを実行] ボタンをクリックして予測出力を検索します。
テストの実行後に、予測出力の統計情報が表示されます。画面上の [ポイント推定] は、ある時点での単一の値です。たとえば、データベースの復元が完了するまでに 134.47 秒かかります。画面の下限と上限は、範囲の精度値を示します。たとえば、データベースの復元が完了するまでに 84.53 秒から 185.41 秒かかります。