Créer et former une solution de régression
Formez votre solution en utilisant des données historiques pour prédire les sorties numériques, telles qu’une température ou une cotation. Par exemple, vous pouvez utiliser la régression pour estimer le temps nécessaire pour résoudre un incident ou un ticket.
Avant de commencer
Rôle requis : ml_admin ou admin
Pourquoi et quand exécuter cette tâche
- L’erreur absolue moyenne (MAE), qui mesure l’écart moyen d’une valeur prévue par rapport à la valeur réelle. Cette mesure est utile car elle est facile à comprendre car son échelle est la même que celle de sa cible. Cependant, MAE n’est pas limité, ce qui rend difficile la comparaison entre les modèles.
- L’erreur de pourcentage absolu moyen symétrique (SMAPE) est une valeur en pourcentage de l’écart entre la valeur prévue et la valeur réelle. SMAPE est une version limitée de MAE, sauf qu’il a une plage de valeurs comprise entre 0 et 100. Plus la valeur SMAPE est faible, meilleure est la précision du modèle.
- La précision de la plage est le pourcentage de valeurs réelles comprises dans une plage prédite. En d’autres termes, il s’agit de la plage entre les limites supérieure et inférieure de la prédiction. Par exemple, si quatre valeurs réelles sur cinq se situent dans la plage prévue, la précision de la plage est de 80 %.
- La largeur moyenne de l’intervalle correspond à la différence entre les limites supérieure et inférieure de la prédiction. Cette mesure explique le niveau d’information de l’intervalle. Plus la largeur moyenne est petite, meilleur est le modèle
Lors de prédictions, la régression vous permet également de spécifier un niveau de confiance pour l'intervalle de prédiction (plage).
Dans cet exemple de procédure, vous créez et formez une définition de solution de régression pour prédire le temps nécessaire à la restauration d’une base de données dans le cloud.
Procédure
Que faire ensuite
Dans cet exemple de scénario, vous avez créé une solution ML à partir de votre définition de solution. Les onglets Statistiques de la solution, Solution de test et Définition de la solution s’affichent dans la section Liens connexes de votre solution ML.
Dans l’onglet Statistiques de la solution, examinez les statistiques d’estimation des points et de plage (intervalle de prédiction) générées par votre solution.
Dans l’onglet Solutions de test de votre solution, vous pouvez tester la sortie de prédiction pour les enregistrements que vous avez utilisés comme entrée de prédiction en saisissant des valeurs pour les champs d’entrée, tels que le centre de données source, le centre de données cible et la taille de la base de données. Vous pouvez également utiliser le niveau de confiance de prédiction par défaut de 95, ou saisir un niveau différent entre 0 et 100. L'utilisation de la valeur 95 signifie que le système est confiant à 95 % que la prédiction réelle se situe dans l'intervalle de prédiction. Cliquez sur le bouton Exécuter le test pour trouver la sortie de prédiction.
Une fois le test exécuté, les statistiques de sortie de prédiction apparaissent. L'estimation des points à l'écran est une valeur unique à un moment donné. Par exemple, la restauration de la base de données prend 134,47 secondes. Les limites inférieure et supérieure à l’écran indiquent une valeur de précision de plage. Par exemple, la restauration de la base de données prend de 84,53 à 185,41 secondes.