Créer et former une solution de régression

Xanadu Activer AI

Release

xanadu

ft:locale

fr-FR

ft:publication_title

Xanadu Activer AI

ft:clusterId

platai

bundleId

platai

workflow

Platform

Créer et former une solution de régression

Rversion finale: Xanadu

Mis à jour 1 août 2024

7 minutes de lecture

Formez votre solution en utilisant des données historiques pour prédire les sorties numériques, telles qu’une température ou une cotation. Par exemple, vous pouvez utiliser la régression pour estimer le temps nécessaire pour résoudre un incident ou un ticket.

Avant de commencer

Important :

La prise en charge des nouvelles solutions de régression est déconseillée dans la Xanadu version. Vous serez toujours en mesure de modifier et de former des solutions existantes, mais vous ne pourrez pas en créer de nouvelles.

Rôle requis : ml_admin ou admin

Pourquoi et quand exécuter cette tâche

Les solutions de régression vous permettent de prédire une estimation de points et un intervalle de prédiction. Le modèle obtenu fournit les statistiques suivantes :

L’erreur absolue moyenne (MAE), qui mesure l’écart moyen d’une valeur prévue par rapport à la valeur réelle. Cette mesure est utile car elle est facile à comprendre car son échelle est la même que celle de sa cible. Cependant, MAE n’est pas limité, ce qui rend difficile la comparaison entre les modèles.
L’erreur de pourcentage absolu moyen symétrique (SMAPE) est une valeur en pourcentage de l’écart entre la valeur prévue et la valeur réelle. SMAPE est une version limitée de MAE, sauf qu’il a une plage de valeurs comprise entre 0 et 100. Plus la valeur SMAPE est faible, meilleure est la précision du modèle.
La précision de la plage est le pourcentage de valeurs réelles comprises dans une plage prédite. En d’autres termes, il s’agit de la plage entre les limites supérieure et inférieure de la prédiction. Par exemple, si quatre valeurs réelles sur cinq se situent dans la plage prévue, la précision de la plage est de 80 %.
La largeur moyenne de l’intervalle correspond à la différence entre les limites supérieure et inférieure de la prédiction. Cette mesure explique le niveau d’information de l’intervalle. Plus la largeur moyenne est petite, meilleur est le modèle

Lors de prédictions, la régression vous permet également de spécifier un niveau de confiance pour l'intervalle de prédiction (plage).

Dans cet exemple de procédure, vous créez et formez une définition de solution de régression pour prédire le temps nécessaire à la restauration d’une base de données dans le cloud.

Procédure

Accédez à la Tout > Intelligence prédictive > Régression > Définitions des solutions.
Cliquez sur Nouveau dans la liste des définitions de régression.

Sur le formulaire de définition de régression, configurez ces champs en suivant les conseils suivants.


Champ	Valeur
Étiquette	Saisissez un nom unique pour votre solution de régression. Par exemple, dans ce cas d’utilisation, vous pouvez entrer dans `Test de régression pour la restauration de la base de données`.
Nom	Au fur et à mesure que vous saisissez la valeur de l’étiquette de votre solution, ce champ se remplit automatiquement avec un nom affecté par le système qui est similaire à la valeur de votre étiquette.
Corpus de mots	Sélectionnez un corpus de mots existant pertinent pour votre solution. Par exemple, dans ce cas d’utilisation, vous sélectionnez un corpus de mots dont le titre est tel que Incidents des 3 derniers mois. Si vous n’avez pas de corpus de mots pertinent, suivez d’abord les étapes pour créer un corpus de mots . Lorsque le corpus de mots est terminé, vous pouvez le sélectionner à partir du champ Corpus de mots dans votre formulaire Définition de régression. Cependant, la sélection du corpus de mots est facultative. Si vos données d'entrée ont des colonnes de texte et que vous ne choisissez pas de corpus de mots, votre solution de régression forme un nouveau modèle de corpus de mots à l'aide des colonnes de texte de vos données d'entrée. Le corpus de mots qui en résulte peut être réutilisé dans n'importe quelle autre solution de régression ou tout autre type de solution d'apprentissage machine. Remarque : Un modèle pré-formé est utilisé à la place du corpus de mots pour les utilisateurs qui l’ont activé Intelligence prédictive à Utahpartir de .
Table	Sélectionnez la table de base de données sur laquelle vous appliquez la régression. La table doit contenir des enregistrements d’historique que le système peut utiliser pour prédire la durée de restauration de sa base de données.
Champ de sortie	Sélectionnez le champ dont vous souhaitez définir la valeur du modèle prédictif. En général, un bon champ de sortie est une valeur numérique, un entier ou un nombre à virgule flottante. Dans cet exemple de scénario, vous utilisez le champ Durée pour mesurer une durée. Le champ de sortie doit générer une valeur numérique.
Champs	Sélectionnez un ou plusieurs types de champs qui aident le système à identifier les enregistrements que vous souhaitez former à l'aide de la régression. Dans cet exemple de scénario, vous utilisez Description brève, Centre de données source, Centre de données cible et Taille de base de données. (short_description, Sourcedc, Targetdc et Dbsize.) Les types de champs d’entrée peuvent être chaîne, nominaux ou numériques.
Filtre	(Facultatif) Ajoutez des conditions de filtre aux enregistrements de champs de sortie que vous souhaitez former à l’aide de la régression. Remarque : le nombre minimum d'enregistrements pour la formation de régression est de 10 000 enregistrements. le nombre maximal d'enregistrements pour la formation de régression est de 300 000.
Langue de traitement	Sélectionnez la langue principale de l’ensemble de données que vous formez sur la définition de solution. Si la langue du jeu de données est l’italien, choisissez Italian. Le traitement en anglais est également appliqué par défaut à tous les jeux de données. Par exemple, si vous sélectionnez l'italien, le système traite les données en anglais et en italien. Remarque : le terme traitement indique certaines des étapes spécifiques à la langue utilisées dans le cadre de la formation d'une solution. Ces étapes incluent la création de jetons pour les mots, la suppression des mots vides et la radicalisation.
Mots vides	Lorsque vous sélectionnez votre langue de traitement, le système ajoute automatiquement une liste de mots vides qui utilise la même langue. Par exemple, si votre langue de traitement est l’italien, la liste Mots vides italien par défaut s’affiche. La liste Mots vides anglais par défaut s’affiche également dans votre sélection. Si vous créez une liste de mots vides personnalisés, vous pouvez la sélectionner à partir du champ Mots vides pour l'ajouter à votre solution. Dans ce scénario, vous utilisez la liste Mots vides anglais par défaut.
Fréquence de la formation	Sélectionnez la fréquence à laquelle le système régénère la solution en fonction des enregistrements correspondant au filtre. Vos options incluent : Exécuter une fois Tous les 30 jours Tous les 60 jours Tous les 90 jours Tous les 120 jours Tous les 180 jours Dans ce scénario, vous sélectionnez Tous les 30 jours Par défaut, le système exécute une seule formation. Cette pratique vous donne le temps d'examiner et de mettre à jour la définition de la solution selon vos besoins jusqu'à ce qu'elle fournisse une couverture et des valeurs de précision acceptables. Remarque : Le nombre minimum d’enregistrements requis pour la formation à la solution de régression est fixé à 10 000. Le planificateur ML limite le nombre de formations qu’une instance peut valider à 50 nouvelles demandes de formation ML par instance dans une fenêtre de 24 heures. Cette limite exclut les demandes planifiées de reformation. En outre, les mises à jour de clustering et de similarité sont également exclues de cette limite, même si les nouvelles demandes de formation dépassent 50 dans une fenêtre de 24 heures.

Cliquez sur l'option ou le bouton de menu contextuel approprié pour la définition de votre solution.

Option	Description
Enregistrer ou Enregistrer et former	Enregistrez l'enregistrement de votre définition de solution pour pouvoir y revenir ultérieurement ou enregistrez-le et soumettez-le pour une formation.
Soumettre ou Soumettre et former	Créez votre enregistrement de définition de solution et soumettez-le, ou soumettez-le et formez-le.

Si vous avez soumis la solution pour une formation, cliquez sur OK dans la fenêtre Activation de la formation pour confirmer.

Le système planifie la solution pour une formation auprès du service de formation le plus proche. Le système vous envoie une notification à l'issue de la formation comprenant les éventuelles erreurs qui se sont produites au cours de celle-ci. Les autres utilisateurs peuvent s'abonner à la catégorie Notifications Intelligence prédictive. Lorsque la formation se termine, le système charge la solution en tant qu'enregistrement de pièce jointe.

Que faire ensuite

Dans cet exemple de scénario, vous avez créé une solution ML à partir de votre définition de solution. Les onglets Statistiques de la solution, Solution de test et Définition de la solution s’affichent dans la section Liens connexes de votre solution ML.

Dans l’onglet Statistiques de la solution, examinez les statistiques d’estimation des points et de plage (intervalle de prédiction) générées par votre solution.

Les statistiques de prédiction pour la solution que vous avez créée et formée.

Dans l’onglet Solutions de test de votre solution, vous pouvez tester la sortie de prédiction pour les enregistrements que vous avez utilisés comme entrée de prédiction en saisissant des valeurs pour les champs d’entrée, tels que le centre de données source, le centre de données cible et la taille de la base de données. Vous pouvez également utiliser le niveau de confiance de prédiction par défaut de 95, ou saisir un niveau différent entre 0 et 100. L'utilisation de la valeur 95 signifie que le système est confiant à 95 % que la prédiction réelle se situe dans l'intervalle de prédiction. Cliquez sur le bouton Exécuter le test pour trouver la sortie de prédiction.

Les valeurs que vous devez entrer pour exécuter un test de sortie de prédiction.

Une fois le test exécuté, les statistiques de sortie de prédiction apparaissent. L'estimation des points à l'écran est une valeur unique à un moment donné. Par exemple, la restauration de la base de données prend 134,47 secondes. Les limites inférieure et supérieure à l’écran indiquent une valeur de précision de plage. Par exemple, la restauration de la base de données prend de 84,53 à 185,41 secondes.

Valeurs de sortie de test pour les prévisions d’estimation ponctuelle et de précision de plage.