Konfigurieren Sie den Connect Component-Algorithmus und die Levenshtein-Distanzmethode für eine Clustering-Lösung

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 1 Minute Lesedauer
  • Wenden Sie die Codierung der Connect-Komponente konfigurieren und der Levenshtein-Distanzmethode an, um das Training für Ihre Clustering-Lösungen zu optimieren.

    Vorbereitungen

    Erforderliche Rolle: admin oder ml_admin
    Hinweis:
    Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert.
    • Erstellen und trainieren Sie eine Clustering-Lösungsdefinition, oder verwenden Sie eine vorhandene.
    • Erforderliche Rolle: admin oder ml_admin

    Warum und wann dieser Vorgang ausgeführt wird

    Beim Trainieren von Clustering-Lösungen haben Sie die folgenden drei Optionen.

    • Verwenden Sie den standardmäßigen K-Means-Algorithmus.
    • Verwenden Sie den optionalen DBSCAN-Lösungsparameter mit der euklidischen Distanzmethode als Metrik.
    • Verwenden Sie die optionalen Lösungsparameter DBSCAN, Mindestanzahl der Nachbarn und Levenshtein-Entfernung. Die Connect-Komponente wird von DBSCAN und der Mindestanzahl von Nachbarn aktiviert und unterstützt sowohl vektorbasierten Absatztext als auch abstandsbasierten Levenshtein-Text. Wenn Sie Ihre Lösung mit der Levenshtein-Distanzmethode trainieren, müssen Sie in Ihrer Clustering-Lösung keinen Wortkorpus verwenden.

    In diesem Beispielszenario trainieren Sie Ihre Lösungsdefinition mithilfe der oben genannten dritten Option.

    Prozedur

    1. Navigieren zu Alle > Predictive Intelligence > Clustering > Lösungsdefinitionen.
    2. Öffnen Sie ein Definitionsformular der trainierten Clustering-Lösung.
    3. Klicken Sie auf der Registerkarte „Erweiterte Lösungseinstellungen“ im Abschnitt „Zugehörige Links“ des Formulars auf Neu.
      Diese Abbildung zeigt, wie Sie die Option Lösungsparameter zum Erstellen des Parameters auswählen.
    4. Erstellen Sie einen Parameterdatensatz.
      1. Klicken Sie im Feld Lösungsparameter auf das Suchsymbol.
      2. Wählen Sie im Bildschirm ML-Lösungsparameter die Option Levenshtein-Abstandaus.
      So erstellen Sie den Parameterdatensatz, indem Sie auf die Schaltfläche „Suchen“ klicken und dann die Kurzbeschreibung des Levenshtein-Abstandsschlüssels auswählen.
    5. Klicken Sie auf Absenden.

      Der Bildschirm mit dem Datensatz der erweiterten Lösungseinstellung wird aktualisiert.

      Der neue Lösungsparameter-Datensatz, den Sie aus den soeben zugewiesenen Werten erstellen.

    6. Klicken Sie auf Absenden.

      Ergebnis: Die Levenshtein-Entfernung ist für Ihre Clustering-Lösung konfiguriert. Der Lösungsparameter wird auf der Registerkarte Erweiterte Lösungseinstellungen Ihres Clustering-Definitionsformulars angezeigt.

      Wenn Sie den von Ihnen erstellten Datensatz übermitteln, wird der Lösungsparameter „Levenshtein-Entfernung“ in Ihrem Clustering-Lösungsdefinitionsformular angezeigt.
    7. Wiederholen Sie die Schritte 1 bis 6 aus dem vorherigen Beispiel für die Levenshtein-Entfernung, außer dass Sie dieses Mal die Lösungsparameter „ Mindestanzahl Nachbarn “ und „ DBSCAN “ erstellen, die zusammen die Connect-Komponentenfunktion aktivieren.
      Die beiden verbleibenden Lösungsparameter, die Sie Ihrer Clustering-Lösung hinzufügen müssen. Diese beiden letzten Parameter aktivieren die Connect-Komponentenfunktion.

      Wenn Sie den Lösungsparameter für die Mindestanzahl von Nachbarn auswählen, konfigurieren und übermitteln, stellen Sie sicher, dass Sie das Feld Benutzereingaben auf den Wert 1festlegen. Nur einige Parameter haben ein Feld Benutzereingaben.

      So fügen Sie dem Feld „Benutzereingaben“ für den Parameter „Mindestanzahl von Nachbarn“ einen Wert hinzu. In diesem Szenario geben Sie den Wert 1 ein.

      Ergebnis:

      Connect-Komponente ist für Ihre Clustering-Lösung konfiguriert. Die beiden Lösungsparameter werden auf der Registerkarte Erweiterte Lösungseinstellungen Ihres Clustering-Definitionsformulars zusammen mit dem Parameter Levenshtein-Abstand angezeigt, den Sie in den Schritten 1 bis 6 dieses Verfahrens konfiguriert haben.

      Die drei Lösungsparameter, die Sie im Abschnitt „Erweiterte Lösungseinstellungen“ Ihrer Clustering-Lösung konfiguriert haben.