| Bezeichnung |
Geben Sie einen eindeutigen Namen für die Clustering-Lösung ein. In diesem Anwendungsfall können Sie beispielsweise Gruppen-Incidents zu einem schwerwiegenden Incident eingeben. |
| Name |
Wenn Sie Ihre Lösungsbezeichnung eingeben, wird dieses Feld automatisch mit einem vom System zugewiesenen Namen basierend auf Ihrem Bezeichnungswert gefüllt. |
| Wortkorpus |
Wenn Sie über eine veraltete Clustering-Lösung verfügen, können Sie im Feld „ Wortkorpus “ im Definitionsformular einen relevanten Wortkorpus auswählen.
Hinweis: Ab Release Xanadu ist kein Wortkorpus erforderlich, da stattdessen ein vortrainiertes Modell verwendet wird. Das Feld „Wortkorpus“ ist im Definitionsformular für vortrainierte Modelle nicht sichtbar.
Weitere Informationen finden Sie unter Wortkorpus erstellen.
|
| Tabelle |
Wählen Sie die Tabelle aus, die Datensatztypen enthält, die Sie in einem oder mehreren Clustern gruppieren möchten. In diesem Anwendungsfall wählen Sie beispielsweise die Tabelle Incident [incident] aus, da sie Incident-Datensätze enthält, die Sie zur Analyse schwerwiegender Incidents gruppieren möchten.
Wenn Sie einen Tabellenwert zuweisen, erscheint ein Link im Formular, der die Anzahl der Datensätze zeigt, die mit ihren aktuellen Bedingungen übereinstimmen.
|
| Felder |
Wählen Sie einen oder mehrere Eingabefeldtypen aus, anhand derer das System die Datensätze identifizieren kann, die Sie in Ihren Cluster aufnehmen möchten. Verwenden Sie in diesem Anwendungsfall Kurzbeschreibung.
Hinweis: Wenn Sie ein Referenztypfeld auswählen, müssen Sie einen Dot-Walk zum Eigenschaftsnamen des Felds durchführen. Beispiel: Anstelle von short_descriptiongeben Sie short_description.nameein.
|
| Gruppe verwenden nach |
Aktivieren Sie dieses Kontrollkästchen nur, wenn Sie Eingabedatensätze nach einem Feld gruppieren möchten, bevor Sie Cluster erstellen.Hinweis: Durch Aktivieren dieses Kontrollkästchens wird die Liste „Gruppieren nach“ aktiviert. Wenn Sie das Kontrollkästchen nicht aktivieren, werden alle Tabellendatensätze in Clustern gruppiert. |
| Gruppieren nach |
Die Auswahl eines Werts aus dieser Liste ist optional. Wenn Sie dies tun, gruppiert das System Datensätze basierend auf Ihrer Auswahl in einen oder mehrere Cluster.
|
| Reinheitsfelder |
Wählen Sie Felder aus Ihrer Tabelle aus, anhand derer das System die Klasse identifizieren kann, die im Cluster am häufigsten vorkommt. Wählen Sie in diesem Beispielszenario Kategorie und Zuweisungsgruppe.Name aus. |
| Filter |
Fügen Sie Filterbedingungen hinzu, die auf die Eingabefeld-Datensätze angewendet werden, die Sie in Ihre Cluster aufnehmen möchten. Die Anzahl der Datensätze für das Clustering ist auf 300.000 beschränkt. Hinweis: Skripteinbindungen können nicht vom Filter referenziert werden. Verwenden Sie als Alternative Datenbankansichten. |
| Verarbeitungssprache |
Wählen Sie die dominante Sprache des Datensatzes aus, den Sie anhand der Lösungsdefinition trainieren. Wenn die Datensatzsprache Italienisch ist, wählen Sie Italienisch aus. Außerdem werden alle Datensätze standardmäßig auch in Englisch verarbeitet. Wenn Sie beispielsweise Italienisch auswählen, verarbeitet das System die Daten sowohl in Englisch als auch in Italienisch.Hinweis: Der Begriff Verarbeitung beinhaltet einige der sprachspezifischen Schritte, die im Rahmen des Trainings einer Lösung verwendet werden. Zum Beispiel das Versehen von Wörtern mit Token, das Entfernen von Stoppwörtern und die Wortstammerkennung. |
| Stoppwörter |
Wenn Sie die Verarbeitungssprache auswählen, fügt das System automatisch eine Stoppwortliste in dieser Sprache hinzu. Wenn Ihre Verarbeitungssprache beispielsweise Italienisch ist, wird die Liste für standardmäßige italienische Stoppwörter angezeigt. Die Liste der standardmäßigen englischen Stoppwörter ist ebenfalls enthalten. Wenn Sie eine anwenderdefinierte Stoppwortliste erstellen, können Sie diese im Feld Stoppwörter auswählen, um sie Ihrer Lösung hinzuzufügen. |
| Aktualisierungshäufigkeit |
Wählen Sie aus, wie oft das System Ihre Cluster mit neuen und aktualisierten Datensätzen aktualisieren soll. Hinweis: Das System ruft Datensätze basierend auf den Filterbedingungen „Gruppieren nach“ ab, die Sie ggf. in Ihrer Clustering-Lösung festgelegt haben.
Wenn Sie beispielsweise Alle 15 Minutenauswählen, erkennt das System, welche Datensätze innerhalb dieses Zeitrahmens eingegangen sind. Das System versucht, sie den vorhandenen Clustern zuzuweisen, oder erstellt, wenn möglich, ein neues Cluster.
In diesem Beispiel kommen 20 neue Datensätze hinzu. Wenn 16 dieser Datensätze in einen vorhandenen Cluster aufgenommen werden und 4 nicht, erstellt das System einen neuen Cluster für die vier nicht zugewiesenen Datensätze.
Sie können auch festlegen, dass Ihre Cluster überhaupt nicht aktualisiert werden sollen.
|
| Schulungshäufigkeit |
Wählen Sie aus, wie oft das System alle vorherigen Clusterergebnisse verwirft und Cluster von Beginn an neu erstellt. Ihre Optionen reichen von täglich über jeden dritten bzw. siebten Tag bis zu monatlich. Sie können Ihren Cluster auch einmal trainieren.Hinweis: Der ML-Planer begrenzt die Anzahl der Trainings, die eine Instanz innerhalb eines 24-Stunden-Fensters committen kann, auf 50 neue ML-Trainingsanforderungen pro Instanz. Der Grenzwert schließt geplante erneute Schulungsanforderungen ein. Darüber hinaus sind Clustering- und Ähnlichkeitsupdates von diesem Grenzwert ausgeschlossen, selbst wenn die neuen Trainingsanforderungen innerhalb eines 24-Stunden-Fensters 50 überschreiten. |
| Mindestanzahl der Datensätze pro Cluster |
Geben Sie die Mindestanzahl der Datensätze ein, die ein Cluster enthalten soll. Der eingegebene Wert muss 2 oder höher sein. |