Konfigurieren Sie den Connect Component-Algorithmus und die Levenshtein-Distanzmethode für eine Clustering-Lösung
Wenden Sie die Codierung der Connect-Komponente konfigurieren und der Levenshtein-Distanzmethode an, um das Training für Ihre Clustering-Lösungen zu optimieren.
Vorbereitungen
Hinweis:
Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert.
- Erstellen und trainieren Sie eine Clustering-Lösungsdefinition, oder verwenden Sie eine vorhandene.
- Erforderliche Rolle: admin oder ml_admin
Warum und wann dieser Vorgang ausgeführt wird
Beim Trainieren von Clustering-Lösungen haben Sie die folgenden drei Optionen.
- Verwenden Sie den standardmäßigen K-Means-Algorithmus.
- Verwenden Sie den optionalen DBSCAN-Lösungsparameter mit der euklidischen Distanzmethode als Metrik.
- Verwenden Sie die optionalen Lösungsparameter DBSCAN, Mindestanzahl der Nachbarn und Levenshtein-Entfernung. Die Connect-Komponente wird von DBSCAN und der Mindestanzahl von Nachbarn aktiviert und unterstützt sowohl vektorbasierten Absatztext als auch abstandsbasierten Levenshtein-Text. Wenn Sie Ihre Lösung mit der Levenshtein-Distanzmethode trainieren, müssen Sie in Ihrer Clustering-Lösung keinen Wortkorpus verwenden.
In diesem Beispielszenario trainieren Sie Ihre Lösungsdefinition mithilfe der oben genannten dritten Option.