Configurer l’algorithme du composant Connect et la méthode de distance de Levenshtein pour une solution de mise en grappe
Appliquez l’encodage de la méthode Configurer le composant Connect et la méthode de distance de Levenshtein pour optimiser la formation de vos solutions de clustering.
Avant de commencer
Remarque :
La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre. Pour plus d'informations, consultez https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847.
- Créez et formez une définition de solution de mise en grappe ou utilisez une définition existante.
- Rôle requis : admin ou ml_admin
Pourquoi et quand exécuter cette tâche
Lors de la formation des solutions de clustering, les trois options suivantes s’offrent à vous.
- Utilisez l’algorithme k-means par défaut.
- Utilisez le paramètre de solution DBSCAN facultatif avec la méthode de distance euclidienne comme mesure.
- Utilisez les paramètres de solution facultatifs DBSCAN, Minimum Neighbors (Voisins minimaux) et Levenshtein Distance (Distance de Levenshtein). Connect Component est activé par DBSCAN et Minimum Neighbors, et prend en charge à la fois le texte basé sur le vecteur de paragraphe et le texte basé sur la distance de Levenshtein. Si vous entraînez votre solution à l’aide de la méthode de distance de Levenshtein, vous n’avez pas besoin d’utiliser un corpus de mots dans votre solution de clustering.
Dans cet exemple de scénario, vous formez votre définition de solution à l’aide de la troisième option référencée ci-dessus.