Configurer HDBSCAN pour une solution de mise en grappe
Rversion finale: Washingtondc
Mis à jour 1 févr. 2024
2 minutes de lecture
Envisagez d’appliquer le codage HDBSCAN (Hierarchical Density Based Spatial Clustering of Applications with Noise) à votre solution de clustering. K-means est l’algorithme de clustering par défaut.
Avant de commencer
Remarque :
La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.
Créez une définition de solution de mise en grappe ou utilisez une définition existante.
Rôle requis : admin ou ml_admin
Pourquoi et quand exécuter cette tâche
Vous pouvez appliquer l’algorithme HDBSCAN pour aider le système à identifier les exemples de données qui ne sont affectés à aucune grappe. Par exemple, vous pouvez appliquer HDBSCAN pour prendre en charge la détection de rubriques.
Predictive Intelligence utilise l’algorithme k-means par défaut dans son cadre de travail de clustering. HSBSCAN est un autre algorithme de clustering similaire à l’algorithme DBSCAN, sauf qu’il fonctionne avec des clusters de taille minimale et peut aider à fournir des clusters plus stables et persistants. Pour un résumé du fonctionnement de HDBSCAN, consultez cet article. Pour une comparaison entre DBSCAN et HDBSCAN, consultez cet article et cet article.
Remarque :
Les solutions de clustering entraînées avec HDBSCAN ne prennent pas en charge les mises à jour de cluster. Les mises à jour de ces solutions échouent et les solutions ne sont pas consignées dans la ml_cluster_detail_table. Utilisez les méthodes d’entraînement DBSCAN ou k-means si vous souhaitez activer les mises à jour de cluster.
Procédure
Accédez à la Tous > Intelligence prédictive > Mise en grappe > Définitions des solutions.
Cliquez sur Nouveau.
Créez un formulaire de définition de solution de mise en grappe ou utilisez un formulaire existant.
Dans cet exemple de scénario, vous créez le formulaire de définition de regroupement hdbscan-sf comme dans l’image ci-dessous. Configurez les champs comme suit :
Étiquette : hdbscan-sf
Corpus de mots : incident_wc, ou tout autre corpus de mots qui contient des données d’enregistrement d’incident
Table : Incident [incident]
Champs : description courte
Fréquence de mise à jour : Ne pas mettre à jour
Mots vides : mots vides anglais par défaut
Fréquence de formation : Tous les 30 jours
Langue de traitement : Anglais
Cliquez sur Soumettre et former.
Sous l’onglet Paramètres de solution avancés de la section Liens connexes du formulaire formé, sélectionnez Paramètres de solution dans le sélecteur, puis cliquez sur Nouveau.
Créez un enregistrement de paramètre.
Dans le champ Paramètres de la solution , cliquez sur l’icône de recherche.
Dans l’écran Paramètres de solution ML, sélectionnez Utiliser HDBSCAN pour la mise en grappe.
Cliquez sur Envoyer.
L’enregistrement Paramètre de solution avancée s’affiche avec l’algorithme HDBSCAN appliqué à l’enregistrement.
Cliquez sur Envoyer.
Résultat : HDBSCAN est configuré pour votre solution de clustering. Son paramètre de solution s’affiche dans l’onglet Paramètres de solution avancés du formulaire Définition de votre solution de mise en grappe.