Configurer l’algorithme du composant Connect et la méthode de distance de Levenshtein pour une solution de mise en grappe

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 2 minutes de lecture
  • Appliquez l’encodage de la méthode Configure Connect Component et Levenshtein Distance pour optimiser l’entraînement de vos solutions de clustering.

    Avant de commencer

    Rôle requis : admin ou ml_admin
    Remarque :
    La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.
    • Créez et formez une définition de solution de clustering ou utilisez une définition existante.
    • Rôle requis : admin ou ml_admin

    Pourquoi et quand exécuter cette tâche

    Lors de la formation de solutions de clustering, vous disposez des trois options suivantes.

    • Utiliser l’algorithme k-means par défaut.
    • Utilisez le paramètre de solution DBSCAN facultatif avec la méthode de distance euclidienne comme métrique.
    • Utilisez les paramètres de solution facultatifs DBSCAN, Voisins minimaux et Distance de Levenshtein. Connect Component est activé par DBSCAN et Minimum Neighbors, et prend en charge à la fois le texte basé sur le vecteur de paragraphe et le texte basé sur la distance de Levenshtein. Si vous entraînez votre solution à l’aide de la méthode de distance de Levenshtein, vous n’avez pas besoin d’utiliser un corpus de mots dans votre solution de clustering.

    Dans cet exemple de scénario, vous formez votre définition de solution à l’aide de la troisième option référencée ci-dessus.

    Procédure

    1. Accédez à la Tous > Intelligence prédictive > Mise en grappe > Définitions des solutions.
    2. Ouvrez un formulaire de définition de solution de clustering formée.
    3. Dans l’onglet Paramètres de solution avancée de la section Liens connexes du formulaire, cliquez sur Nouveau.
      Cette image montre comment sélectionner l’option Paramètres de solution pour créer le paramètre.
    4. Créez un enregistrement de paramètre.
      1. Dans le champ Paramètres de la solution , cliquez sur l’icône de recherche.
      2. Dans l’écran Paramètres de solution ML, sélectionnez Distance de Levenshtein.
      Pour créer l’enregistrement de paramètre, sélectionnez le bouton Rechercher, puis la brève description de la touche Distance de Levenshtein.
    5. Cliquez sur Envoyer.

      L’écran d’enregistrement Paramètres de solution avancée s’actualise.

      Le nouvel enregistrement de paramètre de solution que vous créez à partir des valeurs que vous venez d’affecter.

    6. Cliquez sur Envoyer.

      Résultat: Levenshtein Distance est configuré pour votre solution de clustering. Son paramètre de solution s’affiche dans l’onglet Paramètres de solution avancés de votre formulaire Définition de regroupement.

      Lorsque vous soumettez l’enregistrement que vous avez créé, le paramètre de solution Distance de Levenshtein s’affiche sur votre formulaire de définition de solution d’agrégation.
    7. Répétez les étapes 1 à 6 de l’exemple précédent de distance de Levenshtein, sauf que cette fois-ci, vous créez les paramètres de solution Voisins minimaux et DBSCAN , qui activent ensemble la fonctionnalité Connecter le composant.
      Les deux paramètres de solution restants que vous devez ajouter à votre solution de clustering. Ces deux derniers paramètres activent la fonctionnalité Connecter le composant.

      Lorsque vous sélectionnez, configurez et soumettez le paramètre de solution Voisins minimaux , assurez-vous de définir le champ Entrées de l’utilisateur avec une valeur de 1. Seuls certains paramètres disposent d’un champ Entrées de l’utilisateur.

      Comment ajouter une valeur au champ Entrées de l’utilisateur pour le paramètre Voisins minimum. Dans ce scénario, saisissez la valeur 1.

      Résultat:

      Le composant Connect est configuré pour votre solution de mise en grappe. Ses deux paramètres de solution s’affichent dans l’onglet Advanced Solution Settings (Paramètres de solution avancés) de votre formulaire de définition de clustering, ainsi que le paramètre Levenshtein Distance (Distance de Levenshtein) que vous avez configuré aux étapes 1 à 6 de cette procédure.

      Les trois paramètres de solution que vous avez configurés dans la section Paramètres de solution avancés de votre solution de clustering.