Konfigurieren Sie den Connect Component-Algorithmus und die Levenshtein-Distanzmethode für eine Clustering-Lösung

Washington DC KI aktivieren

Release

washingtondc

ft:locale

de-DE

ft:publication_title

Washington DC KI aktivieren

ft:clusterId

platai

bundleId

platai

workflow

Platform

Konfigurieren Sie den Connect Component-Algorithmus und die Levenshtein-Distanzmethode für eine Clustering-Lösung

Freigeben Version: Washingtondc

Aktualisiert 1. Februar 2024

1 Minute Lesedauer

Wenden Sie die Codierung der Connect-Komponente konfigurieren und der Levenshtein-Distanzmethode an, um das Training für Ihre Clustering-Lösungen zu optimieren.

Vorbereitungen

Erforderliche Rolle: admin oder ml_admin

Hinweis:

Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert.

Erstellen und trainieren Sie eine Clustering-Lösungsdefinition, oder verwenden Sie eine vorhandene.
Erforderliche Rolle: admin oder ml_admin

Warum und wann dieser Vorgang ausgeführt wird

Beim Trainieren von Clustering-Lösungen haben Sie die folgenden drei Optionen.

Verwenden Sie den standardmäßigen K-Means-Algorithmus.
Verwenden Sie den optionalen DBSCAN-Lösungsparameter mit der euklidischen Distanzmethode als Metrik.
Verwenden Sie die optionalen Lösungsparameter DBSCAN, Mindestanzahl der Nachbarn und Levenshtein-Entfernung. Die Connect-Komponente wird von DBSCAN und der Mindestanzahl von Nachbarn aktiviert und unterstützt sowohl vektorbasierten Absatztext als auch abstandsbasierten Levenshtein-Text. Wenn Sie Ihre Lösung mit der Levenshtein-Distanzmethode trainieren, müssen Sie in Ihrer Clustering-Lösung keinen Wortkorpus verwenden.

In diesem Beispielszenario trainieren Sie Ihre Lösungsdefinition mithilfe der oben genannten dritten Option.

Prozedur

Navigieren zu Alle > Predictive Intelligence > Clustering > Lösungsdefinitionen.
Öffnen Sie ein Definitionsformular der trainierten Clustering-Lösung.
Klicken Sie auf der Registerkarte „Erweiterte Lösungseinstellungen“ im Abschnitt „Zugehörige Links“ des Formulars auf Neu.
Erstellen Sie einen Parameterdatensatz.
1. Klicken Sie im Feld Lösungsparameter auf das Suchsymbol.
2. Wählen Sie im Bildschirm ML-Lösungsparameter die Option Levenshtein-Abstandaus.
Klicken Sie auf Absenden.

Der Bildschirm mit dem Datensatz der erweiterten Lösungseinstellung wird aktualisiert.
Klicken Sie auf Absenden.

Ergebnis: Die Levenshtein-Entfernung ist für Ihre Clustering-Lösung konfiguriert. Der Lösungsparameter wird auf der Registerkarte Erweiterte Lösungseinstellungen Ihres Clustering-Definitionsformulars angezeigt.
Wiederholen Sie die Schritte 1 bis 6 aus dem vorherigen Beispiel für die Levenshtein-Entfernung, außer dass Sie dieses Mal die Lösungsparameter „ Mindestanzahl Nachbarn “ und „ DBSCAN “ erstellen, die zusammen die Connect-Komponentenfunktion aktivieren.

Wenn Sie den Lösungsparameter für die Mindestanzahl von Nachbarn auswählen, konfigurieren und übermitteln, stellen Sie sicher, dass Sie das Feld Benutzereingaben auf den Wert 1festlegen. Nur einige Parameter haben ein Feld Benutzereingaben.

Ergebnis:

Connect-Komponente ist für Ihre Clustering-Lösung konfiguriert. Die beiden Lösungsparameter werden auf der Registerkarte Erweiterte Lösungseinstellungen Ihres Clustering-Definitionsformulars zusammen mit dem Parameter Levenshtein-Abstand angezeigt, den Sie in den Schritten 1 bis 6 dieses Verfahrens konfiguriert haben.