Créer et former une solution de régression

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 7 minutes de lecture
  • Formez votre solution en utilisant des données historiques pour prédire les sorties numériques, telles qu’une température ou une cotation. Par exemple, vous pouvez utiliser la régression pour estimer le temps nécessaire pour résoudre un incident ou un ticket.

    Avant de commencer

    Important :
    La prise en charge des nouvelles solutions de régression est obsolète dans la Yokohama version. Vous pourrez toujours modifier et former les solutions existantes, mais vous ne pourrez pas en créer de nouvelles.

    Rôle requis : ml_admin ou admin

    Pourquoi et quand exécuter cette tâche

    Les solutions de régression vous permettent de prédire une estimation de points et un intervalle de prédiction. Le modèle résultant fournit les statistiques suivantes :
    • L’erreur absolue moyenne (MAE), qui mesure l’écart moyen d’une valeur estimée par rapport à la valeur réelle. Cette mesure est utile car elle est facile à comprendre car son échelle est la même que celle de sa cible. Cependant, la MAE est illimitée, ce qui rend difficile la comparaison entre les modèles.
    • L’erreur de pourcentage absolu moyen symétrique (SMAPE) est une valeur en pourcentage de l’écart entre la valeur prévue et la valeur réelle. SMAPE est une version limitée de MAE, sauf qu’il a une plage de valeurs comprise entre 0 et 100. Plus la valeur SMAPE est faible, meilleure est la précision du modèle.
    • La précision de la plage est le pourcentage de valeurs réelles entre une plage prévue. En d’autres termes, il s’agit de la plage entre les limites supérieure et inférieure de la prédiction. Par exemple, si quatre valeurs réelles sur cinq se situent dans la plage prévue, la précision de la plage est de 80 %.
    • La largeur moyenne de l’intervalle correspond à la différence entre les limites supérieure et inférieure de la prédiction. Cette mesure explique dans quelle mesure l’intervalle est informatif. Plus la largeur moyenne est petite, meilleur est le modèle

    Lors de prédictions, la régression vous permet également de spécifier un niveau de confiance pour l'intervalle de prédiction (plage).

    Dans cet exemple de procédure, vous créez et formez une définition de solution de régression pour prédire la durée nécessaire à la restauration d’une base de données cloud.

    Procédure

    1. Accédez à la Tout > Intelligence prédictive > Régression > Définitions des solutions.
    2. Dans la liste Définitions de régression, cliquez sur Nouveau.
    3. Dans le formulaire de définition de régression, configurez ces champs en suivant les instructions suivantes.
      Champ Valeur
      Étiquette Saisissez un nom unique pour votre solution de régression. Par exemple, dans ce cas d’utilisation, vous pouvez entrer Test de régression pour la restauration de base de données.
      Nom Lorsque vous entrez la valeur Étiquette de votre solution, ce champ se remplit automatiquement avec un nom affecté par le système similaire à votre valeur d’étiquette.
      Corpus de mots

      Sélectionnez un corpus de mots existant pertinent pour votre solution. Par exemple, dans ce cas d’utilisation, vous sélectionnez un corpus de mots qui a un titre tel que Incidents au cours des 3 derniers mois.

      Si vous n’avez pas de corpus de mots pertinent, suivez d’abord les étapes pour créer un corpus de mots . Lorsque le corpus de mots est terminé, vous pouvez le sélectionner à partir du champ Corpus de mots dans votre formulaire Définition de régression.

      Cependant, la sélection du corpus de mots est facultative. Si vos données d'entrée ont des colonnes de texte et que vous ne choisissez pas de corpus de mots, votre solution de régression forme un nouveau modèle de corpus de mots à l'aide des colonnes de texte de vos données d'entrée. Le corpus de mots qui en résulte peut être réutilisé dans n'importe quelle autre solution de régression ou tout autre type de solution d'apprentissage machine.

      Remarque :
      Un modèle préformé est utilisé à la place du corpus de mots pour les utilisateurs qui ont activé Intelligence prédictive à partir de Utah.
      Table Sélectionnez la table de base de données sur laquelle vous appliquez la régression. La table doit contenir des enregistrements historiques que le système peut utiliser pour prédire la durée de restauration de sa base de données.
      Champ de sortie

      Sélectionnez le champ dont vous souhaitez définir la valeur du modèle prédictif.

      En général, un bon champ de sortie est une valeur numérique, un entier ou un nombre à virgule flottante.

      Dans cet exemple de scénario, vous utilisez le champ Durée pour mesurer une durée. Le champ de sortie doit générer une valeur numérique.

      Champs Sélectionnez un ou plusieurs types de champs qui aident le système à identifier les enregistrements que vous souhaitez former à l'aide de la régression. Dans cet exemple, vous utilisez Description brève, Centre de données source, Centre de données cible et Taille de la base de données. (short_description, Sourcedc, Targetdc et Dbsize.) Les types de champs d’entrée peuvent être chaîne, nominaux ou numériques.
      Filtre (Facultatif) Ajoutez des conditions de filtre aux enregistrements de champ de sortie que vous souhaitez former à l’aide de la régression.
      Remarque :
      • le nombre minimum d'enregistrements pour la formation de régression est de 10 000 enregistrements.
      • le nombre maximal d'enregistrements pour la formation de régression est de 300 000.
      Langue de traitement Sélectionnez la langue principale de l’ensemble de données que vous formez sur la définition de solution. Si la langue de l’ensemble de données est l’italien, choisissez Italien. Le traitement en anglais est également appliqué par défaut à tous les jeux de données. Par exemple, si vous sélectionnez l'italien, le système traite les données en anglais et en italien.
      Remarque :
      le terme traitement indique certaines des étapes spécifiques à la langue utilisées dans le cadre de la formation d'une solution. Ces étapes incluent la tokenisation des mots, la suppression des mots vides et la radicalisation.
      Mots vides Lorsque vous sélectionnez votre langue de traitement, le système ajoute automatiquement une liste de mots vides qui utilise la même langue. Par exemple, si votre langue de traitement est l’italien, la liste Mots vides italien par défaut s’affiche. La liste Mots vides anglais par défaut s’affiche également dans votre sélection. Si vous créez une liste de mots vides personnalisés, vous pouvez la sélectionner à partir du champ Mots vides pour l'ajouter à votre solution. Dans ce scénario, vous utilisez la liste Mots vides anglais par défaut.
      Fréquence de la formation
      Sélectionnez la fréquence à laquelle le système régénère la solution en fonction des enregistrements correspondant au filtre. Vos options incluent :
      • Exécuter une fois
      • Tous les 30 jours
      • Toutes les 60 jours
      • Tous les 90 jours
      • Tous les 120 jours
      • Tous les 180 jours

      Dans ce scénario, vous sélectionnez Tous les 30 jours

      Par défaut, le système exécute une seule formation. Cette pratique vous donne le temps d'examiner et de mettre à jour la définition de la solution selon vos besoins jusqu'à ce qu'elle fournisse une couverture et des valeurs de précision acceptables.

      Remarque :
      • Le nombre minimum d’enregistrements requis pour la formation à la solution de régression est fixé à 10 000.
      • Le planificateur ML limite le nombre de formations qu’une instance peut valider à 50 nouvelles demandes de formation ML par instance dans une fenêtre de 24 heures. Cette limite exclut les demandes planifiées de reformation. En outre, les mises à jour de mise en grappe et de similarité sont également exclues de cette limite, même si les nouvelles demandes de formation dépassent 50 dans une fenêtre de 24 heures.
    4. Cliquez sur l'option ou le bouton de menu contextuel approprié pour la définition de votre solution.
      OptionDescription
      Enregistrer ou Enregistrer et former Enregistrez l'enregistrement de votre définition de solution pour pouvoir y revenir ultérieurement ou enregistrez-le et soumettez-le pour une formation.
      Soumettre ou Soumettre et former Créez votre enregistrement de définition de solution et soumettez-le, ou soumettez-le et formez-le.
    5. Si vous avez soumis la solution pour une formation, cliquez sur OK dans la fenêtre Activation de la formation pour confirmer.

      Le système planifie la solution pour une formation auprès du service de formation le plus proche. Le système vous envoie une notification à l'issue de la formation comprenant les éventuelles erreurs qui se sont produites au cours de celle-ci. Les autres utilisateurs peuvent s'abonner à la catégorie Notifications Intelligence prédictive. Lorsque la formation se termine, le système charge la solution en tant qu'enregistrement de pièce jointe.

    Que faire ensuite

    Dans cet exemple de scénario, vous avez créé une solution ML à partir de votre définition de solution. Les onglets Statistiques de la solution, Solution test et Définition de la solution s’affichent dans la section Liens connexes de votre solution ML.

    Dans l’onglet Statistiques de la solution, passez en revue les statistiques d’estimation de points et de plage (intervalle de prédiction) générées par votre solution.

    Statistiques de prédiction de la solution que vous avez créée et formée.

    Dans l’onglet Solutions de test de votre solution, vous pouvez tester la sortie de prédiction pour les enregistrements que vous avez utilisés comme entrée dans la prédiction en saisissant des valeurs pour les champs d’entrée, tels que le centre de données source, le centre de données cible et la taille de la base de données. Vous pouvez également utiliser le niveau de confiance de prédiction par défaut de 95, ou saisir un niveau différent entre 0 et 100. L'utilisation de la valeur 95 signifie que le système est confiant à 95 % que la prédiction réelle se situe dans l'intervalle de prédiction. Cliquez sur le bouton Exécuter le test pour trouver la sortie de prédiction.

    Les valeurs que vous devez saisir pour exécuter un test de sortie de prédiction.

    Une fois le test exécuté, les statistiques de sortie de prédiction apparaissent. L'estimation des points à l'écran est une valeur unique à un moment donné. Par exemple, la restauration de la base de données prend 134,47 secondes. Les limites inférieure et supérieure à l’écran signifient une valeur de précision de plage. Par exemple, la restauration de la base de données prend de 84,53 à 185,41 secondes.

    Valeurs de sortie de test pour les prédictions d’estimation de point et de précision de plage.