| Étiquette |
Attribuez un nom unique à votre solution de mise en grappe. Par exemple, dans ce cas d’utilisation, vous pouvez saisir des incidents de groupe pour un incident majeur. |
| Nom |
Lorsque vous saisissez l’étiquette de votre solution, ce champ se remplit automatiquement avec un nom affecté par le système en fonction de la valeur de votre étiquette. |
| Corpus de mots |
Si vous disposez d’une solution de mise en grappe héritée, vous pouvez sélectionner un corpus de mots pertinent dans le champ Corpus de mots du formulaire de définition.
Remarque : Avec la Xanadu version, un corpus de mots n’est pas nécessaire, car un modèle pré-entraîné est utilisé à la place. Le champ Corpus de mots n’est pas visible dans le formulaire de définition pour les modèles pré-formés.
Pour plus d'informations, consultez Créer un corpus de mots.
|
| Table |
Sélectionnez la table contenant les types d’enregistrements que vous souhaitez regrouper en une ou plusieurs grappes. Par exemple, dans ce cas d’utilisation, vous sélectionnez la table Incident [incident], car elle contient les enregistrements d’incidents que vous souhaitez regrouper pour une analyse d’incident majeur.
Lorsque vous affectez une valeur de table, un lien apparaît dans le formulaire qui indique le nombre d’enregistrements qui correspondent à vos conditions actuelles.
|
| Champs |
Sélectionnez un ou plusieurs types de champs d’entrée qui aident le système à identifier les enregistrements que vous souhaitez inclure dans votre cluster. Dans ce cas d’utilisation, utilisez Description brève.
Remarque : Lors de la sélection d’un champ de type référence, vous devez remonter pas à pas jusqu’au nom de propriété du champ. Par exemple, au lieu de short_description, saisissez short_description.name.
|
| Utiliser le groupe par |
Cochez cette case uniquement si vous souhaitez regrouper les enregistrements d’entrées par champ avant de créer des grappes.Remarque : Cocher cette case active la liste Grouper par . Si vous ne cochez pas la case, tous les enregistrements de table sont regroupés en grappes. |
| Grouper par |
La sélection d’une valeur dans cette liste est facultative. Dans ce cas, le système regroupe les enregistrements dans une ou plusieurs grappes en fonction de votre sélection.
|
| Champs de pureté |
Choisissez dans votre table des champs qui peuvent aider le système à identifier la classe la plus fréquente dans la grappe. Dans cet exemple de scénario, sélectionnez Catégorie et Groupe d’affectation. Nom. |
| Filtre |
Ajoutez les conditions de filtre à appliquer aux enregistrements de champs d’entrée que vous souhaitez inclure dans vos clusters. Le nombre d’enregistrements pour la mise en grappe est limité à 300 000. Remarque : Les includes de script ne peuvent pas être référencés à partir du filtre. Utilisez les vues de base de données comme alternative. |
| Langue de traitement |
Sélectionnez la langue dominante du jeu de données que vous formez sur la définition de la solution. Si la langue du jeu de données est l’italien, choisissez Italian. Le traitement en anglais est également appliqué par défaut à tous les jeux de données. Par exemple, si vous sélectionnez l'italien, le système traite les données en anglais et en italien.Remarque : le terme traitement indique certaines des étapes spécifiques à la langue utilisées dans le cadre de la formation d'une solution. Par exemple, la tokénisation des mots, la suppression des mots vides et la racinisation. |
| Mots vides |
Lorsque vous sélectionnez votre langue de traitement, le système ajoute automatiquement une liste de mots vides dans cette langue. Par exemple, si votre langue de traitement est l'italien la liste des Mots vides italiens par défaut s'affiche. La liste des mots vides anglais par défaut est également incluse. Si vous créez une liste de mots vides personnalisée, vous pouvez la sélectionner dans le champ Mots vides pour l’ajouter à votre solution. |
| Fréquence de mise à jour |
Sélectionnez la fréquence à laquelle vous souhaitez que le système mette à jour vos clusters avec des enregistrements nouveaux et mis à jour. Remarque : Le système extrait les enregistrements en fonction des conditions de filtre Grouper par que vous définissez sur votre solution de clustering, le cas échéant.
Par exemple, si vous sélectionnez Toutes les 15 minutes, le système identifie les enregistrements qui sont arrivés dans ce délai. Le système essaie de les affecter aux grappes existantes ou, si possible, crée une nouvelle grappe.
Dans cet exemple, 20 nouveaux enregistrements arrivent. Si 16 de ces enregistrements font partie d’une grappe existante et que 4 ne le font pas, le système forme une nouvelle grappe pour les quatre enregistrements non affectés.
Vous pouvez également choisir de ne pas mettre à jour vos clusters du tout.
|
| Fréquence de la formation |
Sélectionnez la fréquence à laquelle vous souhaitez que le système supprime tous les résultats de grappe précédents et recrée les grappes depuis le début. Vos options vont de tous les jours, tous les trois jours, tous les sept jours ou tous les mois. Vous pouvez également choisir d’entraîner votre cluster une seule fois.Remarque : Le planificateur ML limite le nombre de formations qu’une instance peut valider à 50 nouvelles demandes de formation ML par instance dans une fenêtre de 24 heures. La limite exclut les demandes de reformation planifiées. En outre, les mises à jour de clustering et de similarité sont également exclues de cette limite, même si les nouvelles demandes de formation dépassent 50 dans une fenêtre de 24 heures. |
| Nombre minimum d'enregistrements par grappe |
Saisissez le nombre minimal d’enregistrements que vous souhaitez qu’une grappe contienne. La valeur que vous saisissez doit être supérieure ou égale à 2. |