Configurer l’algorithme du composant Connect et la méthode de distance de Levenshtein pour une solution de mise en grappe
Appliquez l’encodage de la méthode Configure Connect Component et Levenshtein Distance pour optimiser l’entraînement de vos solutions de clustering.
Avant de commencer
Remarque :
La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.
- Créez et formez une définition de solution de clustering ou utilisez une définition existante.
- Rôle requis : admin ou ml_admin
Pourquoi et quand exécuter cette tâche
Lors de la formation de solutions de clustering, vous disposez des trois options suivantes.
- Utiliser l’algorithme k-means par défaut.
- Utilisez le paramètre de solution DBSCAN facultatif avec la méthode de distance euclidienne comme métrique.
- Utilisez les paramètres de solution facultatifs DBSCAN, Voisins minimaux et Distance de Levenshtein. Connect Component est activé par DBSCAN et Minimum Neighbors, et prend en charge à la fois le texte basé sur le vecteur de paragraphe et le texte basé sur la distance de Levenshtein. Si vous entraînez votre solution à l’aide de la méthode de distance de Levenshtein, vous n’avez pas besoin d’utiliser un corpus de mots dans votre solution de clustering.
Dans cet exemple de scénario, vous formez votre définition de solution à l’aide de la troisième option référencée ci-dessus.