Konfigurieren Sie HDBSCAN für eine Clustering-Lösung

Washington DC KI aktivieren

Release

washingtondc

ft:locale

de-DE

ft:publication_title

Washington DC KI aktivieren

ft:clusterId

platai

bundleId

platai

workflow

Platform

Konfigurieren Sie HDBSCAN für eine Clustering-Lösung

Freigeben Version: Washingtondc

Aktualisiert 1. Februar 2024

1 Minute Lesedauer

Erwägen Sie die Anwendung der HDBSCAN-Codierung (Hierarchical Density Based Spatial Clustering of Applications with Rauschen) auf Ihre Clustering-Lösung. Der standardmäßige Clustering-Algorithmus ist k-means.

Vorbereitungen

Hinweis:

Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert.

Erstellen Sie eine Definition für eine Clustering-Lösung, oder verwenden Sie eine vorhandene.
Erforderliche Rolle: admin oder ml_admin

Warum und wann dieser Vorgang ausgeführt wird

Sie können den HDBSCAN-Algorithmus anwenden, um das System bei der Identifizierung von Datenbeispielen zu unterstützen, die keinem Cluster zugewiesen sind. Sie können beispielsweise HDBSCAN anwenden, um die Themenerkennung zu unterstützen.

Standardmäßig verwendet Predictive Intelligence im Clustering-Framework den Algorithmus k-means. HSBSCAN ist ein weiterer Clustering-Algorithmus, der dem DBSCAN-Algorithmus ähnelt, außer dass er mit Clustern minimaler Größe funktioniert und dazu beitragen kann, stabilere und persistentere Cluster bereitzustellen. Eine Zusammenfassung der Funktionsweise von HDBSCAN finden Sie in diesem Artikel. Einen Vergleich zwischen DBSCAN und HDBSCAN finden Sie in diesem Artikel und in diesem Artikel.

Hinweis:

Mit HDBSCAN trainierte Clustering-Lösungen unterstützen keine Cluster-Updates. Updates für diese Lösungen schlagen fehl, und die Lösungen werden nicht in ml_cluster_detail_table protokolliert. Verwenden Sie die Trainingsmethoden DBSCAN oder K-Means, wenn Sie Cluster-Updates aktivieren möchten.

Prozedur

Navigieren zu Alle > Predictive Intelligence > Clustering > Lösungsdefinitionen.
Klicken Sie auf Neu.
Erstellen Sie ein neues Definitionsformular für die Clustering-Lösung, oder verwenden Sie ein vorhandenes.
In diesem Beispielszenario erstellen Sie das Clustering-Definitionsformular hdbscan-sf wie in der folgenden Abbildung dargestellt. Konfigurieren Sie die Felder wie folgt:
- Bezeichnung:hdbscan-sf
- Wortkorpus: incident_wcoder ein anderer Wortkorpus mit Incident-Datensatzdaten
- Tabelle: Incident [incident]
- Felder: Kurzbeschreibung
- Aktualisierungshäufigkeit: Nicht aktualisieren
- Stoppwörter: Standardmäßige englische Stoppwörter
- Schulungshäufigkeit: Alle 30 Tage
- Verarbeitungssprache: Englisch
Klicken Sie auf Absenden und schulen.
Wählen Sie auf der Registerkarte Erweiterte Lösungseinstellungen im Abschnitt „Zugehörige Links“ des trainierten Formulars Lösungsparameter aus der Auswahl aus, und klicken Sie dann auf Neu.
Erstellen Sie einen Parameterdatensatz.
1. Klicken Sie im Feld Lösungsparameter auf das Suchsymbol.
2. Wählen Sie im Bildschirm „ML-Lösungsparameter“ die Option HDBSCAN für Clustering verwenden aus.
Klicken Sie auf Absenden.
Der Datensatz „Erweiterte Lösungseinstellung“ wird mit dem auf den Datensatz angewendeten HDBSCAN-Algorithmus angezeigt.
Klicken Sie auf Absenden.

Ergebnis: HDBSCAN ist für Ihre Clustering-Lösung konfiguriert. Der Lösungsparameter wird auf der Registerkarte „Erweiterte Lösungseinstellungen“ des Formulars zur Definition der Clustering-Lösung angezeigt.