Configurer l’algorithme du composant Connect et la méthode de distance de Levenshtein pour une solution de mise en grappe

Washington DC Activer l’IA

Release

washingtondc

ft:locale

fr-FR

ft:publication_title

Washington DC Activer l’IA

ft:clusterId

platai

bundleId

platai

workflow

Platform

Configurer l’algorithme du composant Connect et la méthode de distance de Levenshtein pour une solution de mise en grappe

Rversion finale: Washingtondc

Mis à jour 1 févr. 2024

2 minutes de lecture

Appliquez l’encodage de la méthode Configure Connect Component et Levenshtein Distance pour optimiser l’entraînement de vos solutions de clustering.

Avant de commencer

Rôle requis : admin ou ml_admin

Remarque :

La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.

Créez et formez une définition de solution de clustering ou utilisez une définition existante.
Rôle requis : admin ou ml_admin

Pourquoi et quand exécuter cette tâche

Lors de la formation de solutions de clustering, vous disposez des trois options suivantes.

Utiliser l’algorithme k-means par défaut.
Utilisez le paramètre de solution DBSCAN facultatif avec la méthode de distance euclidienne comme métrique.
Utilisez les paramètres de solution facultatifs DBSCAN, Voisins minimaux et Distance de Levenshtein. Connect Component est activé par DBSCAN et Minimum Neighbors, et prend en charge à la fois le texte basé sur le vecteur de paragraphe et le texte basé sur la distance de Levenshtein. Si vous entraînez votre solution à l’aide de la méthode de distance de Levenshtein, vous n’avez pas besoin d’utiliser un corpus de mots dans votre solution de clustering.

Dans cet exemple de scénario, vous formez votre définition de solution à l’aide de la troisième option référencée ci-dessus.

Procédure

Accédez à la Tous > Intelligence prédictive > Mise en grappe > Définitions des solutions.
Ouvrez un formulaire de définition de solution de clustering formée.
Dans l’onglet Paramètres de solution avancée de la section Liens connexes du formulaire, cliquez sur Nouveau.
Créez un enregistrement de paramètre.
1. Dans le champ Paramètres de la solution , cliquez sur l’icône de recherche.
2. Dans l’écran Paramètres de solution ML, sélectionnez Distance de Levenshtein.
Cliquez sur Envoyer.

L’écran d’enregistrement Paramètres de solution avancée s’actualise.
Cliquez sur Envoyer.

Résultat: Levenshtein Distance est configuré pour votre solution de clustering. Son paramètre de solution s’affiche dans l’onglet Paramètres de solution avancés de votre formulaire Définition de regroupement.
Répétez les étapes 1 à 6 de l’exemple précédent de distance de Levenshtein, sauf que cette fois-ci, vous créez les paramètres de solution Voisins minimaux et DBSCAN , qui activent ensemble la fonctionnalité Connecter le composant.

Lorsque vous sélectionnez, configurez et soumettez le paramètre de solution Voisins minimaux , assurez-vous de définir le champ Entrées de l’utilisateur avec une valeur de 1. Seuls certains paramètres disposent d’un champ Entrées de l’utilisateur.

Résultat:

Le composant Connect est configuré pour votre solution de mise en grappe. Ses deux paramètres de solution s’affichent dans l’onglet Advanced Solution Settings (Paramètres de solution avancés) de votre formulaire de définition de clustering, ainsi que le paramètre Levenshtein Distance (Distance de Levenshtein) que vous avez configuré aux étapes 1 à 6 de cette procédure.