Créer et former une solution de classification

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 8 minutes de lecture
  • Spécifiez les enregistrements utilisés pour former une solution de classification, les champs qui déclenchent une prédiction et la fréquence de reformation de votre solution.

    Avant de commencer

    • Créez une liste de mots vides personnalisés.
    • Rôle requis : admin ou ml_admin

    Pourquoi et quand exécuter cette tâche

    Intelligence prédictive prend en charge les solutions de formation dans lesquelles les données sources sont protégées par ces types de chiffrement.
    • FDE (chiffrement complet du disque).
    • Chiffrement au niveau des colonnes. Lors de l’utilisation de Column Level Encryption, assurez-vous que l’utilisateur sharedservice.worker dispose du même rôle de module de chiffrement que celui utilisé pour le chiffrement.
    Remarque :
    Intelligence prédictive ne prend pas en charge les solutions de formation où les données sources sont chiffrées par Edge Encryption.

    La qualité d’un modèle prédictif dépend des données que vous utilisez pour l’entraîner. Pour sélectionner les enregistrements de formation appropriés, familiarisez-vous avec le dictionnaire de base de données de table ainsi qu’avec la qualité actuelle des valeurs d’enregistrement que vous souhaitez utiliser.

    Vous devez créer un enregistrement de définition de solution distinct pour chaque modèle prédictif que vous souhaitez prendre en charge. Vous pouvez copier un enregistrement de définition de solution et sa configuration dans un nouveau formulaire en cliquant sur Copier la définition de solution dans le menu contextuel. Vous pouvez utiliser le nouvel enregistrement pour effectuer d’autres mises à jour de solution sans reconfigurer l’ensemble de la définition de solution.

    Remarque :
    Les classes qui ont moins de 30 enregistrements dans votre jeu de données de formation sont exclues de la formation de la solution. Lorsque votre solution est formée et terminée, toutes les classes exclues sont répertoriées dans la section Statistiques de la solution du formulaire de votre solution ML.

    Toutes les classes qui ont été exclues de votre formation sur la solution sont répertoriées dans la section Statistiques de la solution du formulaire de la solution ML de votre solution formée.

    Procédure

    1. Accédez à la Tous > Intelligence prédictive > Classification > Définitions des solutions.
    2. Dans la liste Définitions de classification, cliquez sur Nouveau.
    3. Sur le formulaire Définition de classification vide, configurez ces champs selon les conseils suivants.
      Champ Valeur
      Étiquette Entrez un nom unique pour l’enregistrement de solution.
      Nom Le système génère la valeur de ce champ en lecture seule en fonction de la valeur Étiquette que vous avez saisie.
      Corpus de mots

      Sélectionnez un corpus de mots existant pertinent pour votre solution. Par exemple, dans ce cas d’utilisation, vous sélectionnez un corpus de mots avec un titre tel que Incidents au cours des 3 derniers mois.

      Si vous n’avez pas de corpus de mots pertinent, suivez d’abord les étapes pour créer un corpus de mots . Lorsque le corpus de mots est terminé, vous pouvez le sélectionner à partir du champ Corpus de mots de votre formulaire Définition de classification.

      Remarque :
      Word Corpus n’est pas un champ obligatoire pour les clients qui implémentent Intelligence prédictive pour la première fois à partir de l’Utah. Un modèle pré-entraîné est utilisé à la place.
      Table Sélectionnez la table contenant les enregistrements cibles que vous souhaitez que le système prédise.
      Champ de sortie

      Sélectionnez le champ dont vous souhaitez définir la valeur du modèle prédictif.

      En général, un bon champ de sortie présente ces caractéristiques.
      • Il s’agit d’un champ de choix ou d’un champ de chaîne avec un ensemble fini de valeurs possibles.
      • Il existe un lien de causalité avec les champs d’entrée.

      Par exemple, la définition de la solution Catégorisation des incidents par défaut utilise le champ Catégorie comme champ de sortie.

      Champs

      Sélectionnez les champs d’entrée que vous souhaitez que la solution utilise pour générer une prédiction.

      Les champs d’entrée sont des champs dans un enregistrement qui peuvent contenir les informations de classification dont votre solution de prédiction a besoin pour réussir. Par exemple, si vous prédisez la classe correcte pour le triage d’un enregistrement d’incident, la prédiction doit collecter les enregistrements contenant du texte faisant référence à la classe. La plupart des enregistrements ont du texte contextuel dans leur champ Brève description , il s’agit donc d’un excellent champ d’entrée à utiliser en général. Vous pouvez également utiliser Notes de résolution comme champ d’entrée, car il peut également faire référence à la classe d’incident dans les notes détaillées de l’incident.

      En général, les bons champs d’entrée ont ces caractéristiques.
      • Les champs sont disponibles pour les utilisateurs lors de la création d’enregistrements.
      • Le type de données de champ peut être une chaîne, une référence, un choix ou HTML. Plus un champ fournit d’informations, plus une solution peut faire une prédiction et plus les prédictions sont précises.
      • Le champ a une valeur par défaut et ne doit pas être vide.

      Toutes les définitions de solutions par défaut utilisent le champ Brève description .

      Filtre

      Cliquez sur Ajouter une condition de filtre pour appliquer des conditions aux enregistrements que vous formez.

      Par exemple, la définition de solution de catégorisation des incidents utilise un filtre avec les conditions suivantes : [Créé][le][12 derniers mois] ET [Actif][est][faux] ET [État][est l’un des][Résolu | Fermé]

      Pour former une solution, le filtre doit renvoyer au moins un enregistrement. Si votre filtre ne renvoie aucun enregistrement, mettez-le à jour jusqu’à ce qu’il renvoie des enregistrements pour l’entraînement.
      Remarque :
      Le nombre recommandé d’enregistrements pour la formation d’une bonne solution est compris entre 30 000 et 300 000. Si vous soumettez plus de 300 000 enregistrements, les 300 000 enregistrements les plus récents sont utilisés pour former la solution. Utilisez uniquement des enregistrements authentiques provenant de la base de données.
      La qualité d’une solution dépend des données que vous utilisez pour la former. En général, un bon filtre présente ces caractéristiques.
      • Les enregistrements de formation sont inactifs et ont des états de tâche qui représentent l’achèvement du travail dans le cadre de votre processus standard (par exemple, résolu ou fermé).
      • Les enregistrements de formation contiennent uniquement des valeurs correctes pour le champ cible. Filtrez les enregistrements avec des valeurs de champ cible peu fiables. Par exemple, si vous prédisez le groupe/la catégorie d’affectation et que vous avez des groupes/catégories d’affectation dans vos données d’incident historiques qui ne sont plus utilisés, ajoutez un filtre pour supprimer ces enregistrements d’incidents de la formation.
      • Les enregistrements de formation contiennent plusieurs exemples de chaque valeur de champ cible que vous souhaitez que la solution prédise.
      • Les enregistrements de formation comprennent des variantes courantes des champs d’entrée.

      N’utilisez pas de dates codées en dur comme filtres, car ces filtres ne sont pas mis à jour lorsque les solutions sont réentraînées, sauf si vous les mettez à jour manuellement avant chaque nouvelle formation. Utilisez plutôt des filtres de dates relatives, tels que les 3 derniers mois, les 6 derniers mois et les 12 derniers mois.

      Langue de traitement Sélectionnez la langue dominante du jeu de données que vous formez sur la définition de la solution. Si la langue du jeu de données est l’italien, choisissez l’italien. Le traitement en anglais est également appliqué par défaut à tous les jeux de données. Par exemple, si vous sélectionnez l'italien, le système traite les données en anglais et en italien.
      Remarque :
      le terme traitement indique certaines des étapes spécifiques à la langue utilisées dans le cadre de la formation d'une solution. Par exemple, la tokénisation des mots, la suppression des mots vides et la racinisation.
      Mots vides Lorsque vous sélectionnez votre langue de traitement, le système ajoute automatiquement une liste de mots vides qui utilise la même langue. Par exemple, si votre langue de traitement est l'italien la liste des Mots vides italiens par défaut s'affiche. La liste Mots vides anglais par défaut s’affiche également dans votre sélection. Si vous créez une liste de mots vides personnalisés, vous pouvez la sélectionner à partir du champ Mots vides pour l'ajouter à votre solution.
      Fréquence de la formation
      Sélectionnez la fréquence à laquelle le système régénère la solution en fonction des enregistrements correspondant au filtre. Vos options incluent :
      • Exécuter une fois
      • Tous les 30 jours
      • Tous les 60 jours
      • Tous les 90 jours
      • Tous les 120  jours
      • Tous les 180 jours
      Remarque :
      Le nombre minimum d’enregistrements requis pour la formation de solution de classification est fixé à 10 000.

      Par défaut, le système exécute une seule formation. Cette pratique vous donne le temps d'examiner et de mettre à jour la définition de la solution selon vos besoins jusqu'à ce qu'elle fournisse une couverture et des valeurs de précision acceptables.

      Lorsque la définition de votre solution est assez stable, envisagez des formations planifiées, car les données peuvent vieillir au fil du temps, ce qui dégrade la précision de votre modèle de prédiction.

      Remarque :
      Le planificateur d’apprentissage machine limite le nombre de formations qu’une instance peut valider à 50 nouvelles demandes de formation d’apprentissage machine par instance dans une fenêtre de 24 heures. Cette limite exclut les demandes de reformation planifiées, les mises à jour de mise en grappe et les mises à jour de similarité, même si les nouvelles demandes de formation dépassent 50 dans une fenêtre de 24 heures.
    4. Cliquez sur l'option ou le bouton de menu contextuel approprié pour la définition de votre solution.
      OptionDescription
      Enregistrer ou Enregistrer et former Enregistrez l'enregistrement de votre définition de solution pour pouvoir y revenir ultérieurement ou enregistrez-le et soumettez-le pour une formation.
      Soumettre ou Soumettre et former Créez votre enregistrement de définition de solution et soumettez-le, ou soumettez-le et formez-le.
    5. Si vous avez soumis la solution pour une formation, cliquez sur OK dans la fenêtre Activation de la formation pour confirmer.
      • Le système planifie la solution pour une formation auprès du service de formation le plus proche. Le système vous envoie une notification à l'issue de la formation comprenant les éventuelles erreurs qui se sont produites au cours de celle-ci. Les autres utilisateurs peuvent s'abonner à la catégorie Notifications Intelligence prédictive. Lorsque la formation se termine, le système charge la solution en tant qu'enregistrement de pièce jointe.
      • Un graphique à bulles remplit l’onglet Visualisation de la solution de votre formulaire de solution, affichant la précision et la couverture estimées pour chacune des classes couvertes par la solution. La taille de la bulle indique le % d’enregistrements (distribution) qui appartiennent à la classe. Lorsque vous pointez sur une bulle, vous pouvez voir sa couverture estimée, sa précision estimée et sa distribution.
      La précision et la couverture estimées pour chacune des classes couvertes par la solution.

    Que faire ensuite

    Dans la section Confiance de classe de l’onglet Statistiques de la solution de votre solution, examinez les statistiques de précision et de couverture de la solution formée.

    Dans l’onglet Solutions de test de votre solution, vous pouvez tester la sortie de prédiction en saisissant des valeurs à partir des champs d’entrée, tels que la brève description.

    Comment tester la sortie de prédiction pour les enregistrements que vous avez utilisés comme entrée dans la prédiction en saisissant des valeurs à partir des champs d’entrée, tels que la brève description