Configurer HDBSCAN pour une solution de mise en grappe

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 2 minutes de lecture
  • Envisagez d’appliquer le codage HDBSCAN (Hierarchical Density Based Spatial Clustering of Applications with Noise) à votre solution de clustering. K-means est l’algorithme de clustering par défaut.

    Avant de commencer

    Remarque :
    La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.
    • Créez une définition de solution de mise en grappe ou utilisez une définition existante.
    • Rôle requis : admin ou ml_admin

    Pourquoi et quand exécuter cette tâche

    Vous pouvez appliquer l’algorithme HDBSCAN pour aider le système à identifier les exemples de données qui ne sont affectés à aucune grappe. Par exemple, vous pouvez appliquer HDBSCAN pour prendre en charge la détection de rubriques.

    Predictive Intelligence utilise l’algorithme k-means par défaut dans son cadre de travail de clustering. HSBSCAN est un autre algorithme de clustering similaire à l’algorithme DBSCAN, sauf qu’il fonctionne avec des clusters de taille minimale et peut aider à fournir des clusters plus stables et persistants. Pour un résumé du fonctionnement de HDBSCAN, consultez cet article. Pour une comparaison entre DBSCAN et HDBSCAN, consultez cet article et cet article.

    Remarque :
    Les solutions de clustering entraînées avec HDBSCAN ne prennent pas en charge les mises à jour de cluster. Les mises à jour de ces solutions échouent et les solutions ne sont pas consignées dans la ml_cluster_detail_table. Utilisez les méthodes d’entraînement DBSCAN ou k-means si vous souhaitez activer les mises à jour de cluster.

    Procédure

    1. Accédez à la Tous > Intelligence prédictive > Mise en grappe > Définitions des solutions.
      Chemin de navigation Predictive Intelligence vers la vue de liste Définitions de mise en grappe, où vous créez une nouvelle définition de solution de mise en grappe.
    2. Cliquez sur Nouveau.
    3. Créez un formulaire de définition de solution de mise en grappe ou utilisez un formulaire existant.
      Dans cet exemple de scénario, vous créez le formulaire de définition de regroupement hdbscan-sf comme dans l’image ci-dessous. Configurez les champs comme suit :
      • Étiquette : hdbscan-sf
      • Corpus de mots : incident_wc, ou tout autre corpus de mots qui contient des données d’enregistrement d’incident
      • Table : Incident [incident]
      • Champs : description courte
      • Fréquence de mise à jour : Ne pas mettre à jour
      • Mots vides : mots vides anglais par défaut
      • Fréquence de formation : Tous les 30 jours
      • Langue de traitement : Anglais
      Exemple de définition de solution de mise en grappe que vous créez et sur laquelle vous appliquerez le paramètre DBSCAN.
    4. Cliquez sur Soumettre et former.
    5. Sous l’onglet Paramètres de solution avancés de la section Liens connexes du formulaire formé, sélectionnez Paramètres de solution dans le sélecteur, puis cliquez sur Nouveau.
      Comment sélectionner l’option Paramètres de solution pour créer le paramètre.
    6. Créez un enregistrement de paramètre.
      1. Dans le champ Paramètres de la solution , cliquez sur l’icône de recherche.
      2. Dans l’écran Paramètres de solution ML, sélectionnez Utiliser HDBSCAN pour la mise en grappe.
        Pour créer l’enregistrement de paramètre, sélectionnez le bouton Rechercher, puis la description brève de la clé HDBSCAN.
    7. Cliquez sur Envoyer.
      L’enregistrement Paramètre de solution avancée s’affiche avec l’algorithme HDBSCAN appliqué à l’enregistrement.
      Le nouvel enregistrement de paramètre de solution que vous créez à partir des valeurs que vous venez d’affecter.
    8. Cliquez sur Envoyer.
      Résultat : HDBSCAN est configuré pour votre solution de clustering. Son paramètre de solution s’affiche dans l’onglet Paramètres de solution avancés du formulaire Définition de votre solution de mise en grappe.
      Lorsque vous soumettez l’enregistrement que vous avez créé, le paramètre de solution HDBSCAN s’affiche sur votre formulaire de définition de solution de clustering.