| Étiquette |
Entrez un nom unique pour l’enregistrement de solution. |
| Nom |
Le système génère la valeur de ce champ en lecture seule en fonction de la valeur Étiquette que vous avez saisie. |
| Corpus de mots |
Sélectionnez un corpus de mots existant pertinent pour votre solution. Par exemple, dans ce cas d’utilisation, vous sélectionnez un corpus de mots avec un titre tel que Incidents au cours des 3 derniers mois.
Si vous n’avez pas de corpus de mots pertinent, suivez d’abord les étapes pour créer un corpus de mots . Lorsque le corpus de mots est terminé, vous pouvez le sélectionner à partir du champ Corpus de mots de votre formulaire Définition de classification.
Remarque : Word Corpus n’est pas un champ obligatoire pour les clients qui implémentent Intelligence prédictive pour la première fois à partir de l’Utah. Un modèle pré-entraîné est utilisé à la place. |
| Table |
Sélectionnez la table contenant les enregistrements cibles que vous souhaitez que le système prédise. |
| Champ de sortie |
Sélectionnez le champ dont vous souhaitez définir la valeur du modèle prédictif.
En général, un bon champ de sortie présente ces caractéristiques.
- Il s’agit d’un champ de choix ou d’un champ de chaîne avec un ensemble fini de valeurs possibles.
- Il existe un lien de causalité avec les champs d’entrée.
Par exemple, la définition de la solution Catégorisation des incidents par défaut utilise le champ Catégorie comme champ de sortie. |
| Champs |
Sélectionnez les champs d’entrée que vous souhaitez que la solution utilise pour générer une prédiction.
Les champs d’entrée sont des champs dans un enregistrement qui peuvent contenir les informations de classification dont votre solution de prédiction a besoin pour réussir. Par exemple, si vous prédisez la classe correcte pour le triage d’un enregistrement d’incident, la prédiction doit collecter les enregistrements contenant du texte faisant référence à la classe. La plupart des enregistrements ont du texte contextuel dans leur champ Brève description , il s’agit donc d’un excellent champ d’entrée à utiliser en général. Vous pouvez également utiliser Notes de résolution comme champ d’entrée, car il peut également faire référence à la classe d’incident dans les notes détaillées de l’incident.
En général, les bons champs d’entrée ont ces caractéristiques.
- Les champs sont disponibles pour les utilisateurs lors de la création d’enregistrements.
- Le type de données de champ peut être une chaîne, une référence, un choix ou HTML. Plus un champ fournit d’informations, plus une solution peut faire une prédiction et plus les prédictions sont précises.
- Le champ a une valeur par défaut et ne doit pas être vide.
Toutes les définitions de solutions par défaut utilisent le champ Brève description . |
| Filtre |
Cliquez sur Ajouter une condition de filtre pour appliquer des conditions aux enregistrements que vous formez.
Par exemple, la définition de solution de catégorisation des incidents utilise un filtre avec les conditions suivantes : [Créé][le][12 derniers mois] ET [Actif][est][faux] ET [État][est l’un des][Résolu | Fermé]
Pour former une solution, le filtre doit renvoyer au moins un enregistrement. Si votre filtre ne renvoie aucun enregistrement, mettez-le à jour jusqu’à ce qu’il renvoie des enregistrements pour l’entraînement. Remarque : Le nombre recommandé d’enregistrements pour la formation d’une bonne solution est compris entre 30 000 et 300 000. Si vous soumettez plus de 300 000 enregistrements, les 300 000 enregistrements les plus récents sont utilisés pour former la solution. Utilisez uniquement des enregistrements authentiques provenant de la base de données.
La qualité d’une solution dépend des données que vous utilisez pour la former. En général, un bon filtre présente ces caractéristiques.
- Les enregistrements de formation sont inactifs et ont des états de tâche qui représentent l’achèvement du travail dans le cadre de votre processus standard (par exemple, résolu ou fermé).
- Les enregistrements de formation contiennent uniquement des valeurs correctes pour le champ cible. Filtrez les enregistrements avec des valeurs de champ cible peu fiables. Par exemple, si vous prédisez le groupe/la catégorie d’affectation et que vous avez des groupes/catégories d’affectation dans vos données d’incident historiques qui ne sont plus utilisés, ajoutez un filtre pour supprimer ces enregistrements d’incidents de la formation.
- Les enregistrements de formation contiennent plusieurs exemples de chaque valeur de champ cible que vous souhaitez que la solution prédise.
- Les enregistrements de formation comprennent des variantes courantes des champs d’entrée.
N’utilisez pas de dates codées en dur comme filtres, car ces filtres ne sont pas mis à jour lorsque les solutions sont réentraînées, sauf si vous les mettez à jour manuellement avant chaque nouvelle formation. Utilisez plutôt des filtres de dates relatives, tels que les 3 derniers mois, les 6 derniers mois et les 12 derniers mois. |
| Langue de traitement |
Sélectionnez la langue dominante du jeu de données que vous formez sur la définition de la solution. Si la langue du jeu de données est l’italien, choisissez l’italien. Le traitement en anglais est également appliqué par défaut à tous les jeux de données. Par exemple, si vous sélectionnez l'italien, le système traite les données en anglais et en italien.Remarque : le terme traitement indique certaines des étapes spécifiques à la langue utilisées dans le cadre de la formation d'une solution. Par exemple, la tokénisation des mots, la suppression des mots vides et la racinisation. |
| Mots vides |
Lorsque vous sélectionnez votre langue de traitement, le système ajoute automatiquement une liste de mots vides qui utilise la même langue. Par exemple, si votre langue de traitement est l'italien la liste des Mots vides italiens par défaut s'affiche. La liste Mots vides anglais par défaut s’affiche également dans votre sélection. Si vous créez une liste de mots vides personnalisés, vous pouvez la sélectionner à partir du champ Mots vides pour l'ajouter à votre solution. |
| Fréquence de la formation |
Sélectionnez la fréquence à laquelle le système régénère la solution en fonction des enregistrements correspondant au filtre. Vos options incluent :
- Exécuter une fois
- Tous les 30 jours
- Tous les 60 jours
- Tous les 90 jours
- Tous les 120 jours
- Tous les 180 jours
Remarque : Le nombre minimum d’enregistrements requis pour la formation de solution de classification est fixé à 10 000.
Par défaut, le système exécute une seule formation. Cette pratique vous donne le temps d'examiner et de mettre à jour la définition de la solution selon vos besoins jusqu'à ce qu'elle fournisse une couverture et des valeurs de précision acceptables.
Lorsque la définition de votre solution est assez stable, envisagez des formations planifiées, car les données peuvent vieillir au fil du temps, ce qui dégrade la précision de votre modèle de prédiction.
Remarque : Le planificateur d’apprentissage machine limite le nombre de formations qu’une instance peut valider à 50 nouvelles demandes de formation d’apprentissage machine par instance dans une fenêtre de 24 heures. Cette limite exclut les demandes de reformation planifiées, les mises à jour de mise en grappe et les mises à jour de similarité, même si les nouvelles demandes de formation dépassent 50 dans une fenêtre de 24 heures. |