Konfigurieren Sie HDBSScan für eine -Clustering-Lösung
Freigeben Version: Xanadu
Aktualisiert 1. August 2024
1 Minute Lesedauer
Erwägen Sie, die HDBSScan-Codierung (Hierarchical Density Based Spatial Clustering of Applications with Rauschen) auf Ihre Clustering-Lösung anzuwenden. Der standardmäßige Clustering-Algorithmus ist k-means.
Erstellen Sie eine Definition für eine Clustering-Lösung, oder verwenden Sie eine vorhandene.
Erforderliche Rolle: admin oder ml_admin
Warum und wann dieser Vorgang ausgeführt wird
Sie können den HDBSScan-Algorithmus anwenden, damit das System Datenbeispiele identifiziert, die keinem Cluster zugewiesen sind. Sie können beispielsweise HDBSScan anwenden, um die Themen-Discovery zu unterstützen.
Standardmäßig verwendet Predictive Intelligence im Clustering-Framework den Algorithmus k-means. HSBSScan ist ein weiterer Clustering-Algorithmus, der dem DBSScan-Algorithmus ähnelt. Der einzige Unterschied besteht darin, dass er mit Clustern minimaler Größe funktioniert und stabilere und persistentere Cluster bereitstellen kann. Eine Zusammenfassung der Funktionsweise von HDBSScan finden Sie in diesem Artikel. Einen Vergleich zwischen DB-Scan und HDBS-Scan finden Sie in diesem Artikel und im Artikel.
Hinweis:
Mit HDBSScan trainierte Clustering-Lösungen unterstützen keine Cluster-Updates. Updates für diese Lösungen schlagen fehl, und die Lösungen werden nicht in „ml_cluster_detail_table“ protokolliert. Verwenden Sie die Trainingsmethoden DB-Scan oder k-Means, wenn Sie Cluster-Updates aktivieren möchten.
Prozedur
Navigieren zu Alle > Predictive Intelligence > Clustering > Lösungsdefinitionen.
Klicken Sie auf Neu.
Erstellen Sie ein neues Definitionsformular für die Clusterlösung, oder verwenden Sie ein vorhandenes.
In diesem Beispielszenario erstellen Sie das Clustering-Definitionsformular „hdbscan-sf“ wie in der Abbildung unten dargestellt. Konfigurieren Sie die Felder wie folgt:
Bezeichnung:hdbscan-sf
Wortkorpus: incident_wcoder ein anderer Wortkorpus, der Incident-Datensatzdaten enthält
Tabelle: Incident [incident]
Felder: Kurzbeschreibung
Aktualisierungshäufigkeit: Nicht aktualisieren
Stoppwörter: Standardmäßige englische Stoppwörter
Schulungshäufigkeit: Alle 30 Tage
Verarbeitungssprache: Englisch
Klicken Sie auf Absenden und trainieren.
Wählen Sie auf der Registerkarte Erweiterte Lösungseinstellungen im Abschnitt „Zugehörige Links“ des trainierten Formulars in der Auswahl Lösungsparameter aus, und klicken Sie dann auf Neu.
Erstellen Sie einen Parameterdatensatz.
Klicken Sie im Feld Lösungsparameter auf das Suchsymbol.
Wählen Sie im Bildschirm ML-Lösungsparameter die Option HDBSScan für Clustering verwenden aus.
Klicken Sie auf Absenden.
Der Datensatz „Erweiterte Lösungseinstellung“ wird mit dem auf den Datensatz angewendeten HDBSScan-Algorithmus angezeigt.
Klicken Sie auf Absenden.
Ergebnis: HDBSScan ist für Ihre Clustering-Lösung konfiguriert. Der Lösungsparameter wird auf der Registerkarte „Erweiterte Lösungseinstellungen“ des Formulars zur Definition der Clustering-Lösung angezeigt.