| Bezeichnung |
Geben Sie einen eindeutigen Namen für die Clustering-Lösung ein. In diesem Anwendungsfall können Sie beispielsweise Gruppen-Incidents zu einem schwerwiegenden Incident eingeben. |
| Name |
Wenn Sie eine Lösungsbezeichnung eingeben, wird dieses Feld automatisch mit einem vom System zugewiesenen Namen gefüllt, der Ihrem Bezeichnungswert ähnelt. |
| Wortkorpus |
Wenn Sie eine ältere Clustering-Lösung haben, können Sie einen relevanten Wortkorpus aus dem Feld Wortkorpus im Definitionsformular auswählen.
Hinweis: Mit Release Washington DC ist kein Wortkorpus mehr erforderlich, da stattdessen ein vortrainiertes Modell verwendet wird. Das Feld Wortkorpus ist im Definitionsformular für vortrainierte Modelle nicht sichtbar.
Weitere Informationen finden Sie unter Wortkorpus erstellen. |
| Tabelle |
Wählen Sie die Tabelle aus, die Datensatztypen enthält, die Sie in einem oder mehreren Clustern gruppieren möchten. In diesem Anwendungsfall wählen Sie beispielsweise die Tabelle Incident [incident] aus, da sie Incident-Datensätze enthält, die Sie zur Analyse schwerwiegender Incidents gruppieren möchten.
Wenn Sie einen Tabellenwert zuweisen, erscheint ein Link im Formular, der die Anzahl der Datensätze zeigt, die mit ihren aktuellen Bedingungen übereinstimmen. |
| Felder |
Wählen Sie einen oder mehrere Eingabefeldtypen aus, die dem System helfen, die Datensätze zu identifizieren, die Sie in Ihren Cluster aufnehmen möchten. Verwenden Sie in diesem Anwendungsfall Kurzbeschreibung.Hinweis: Wenn Sie ein Referenzfeld auswählen, müssen Sie per Dot-Walk zum Eigenschaftsnamen des Felds gehen. Geben Sie beispielsweise anstelle von short_descriptionshort_description.nameein. |
| Gruppe verwenden nach |
Aktivieren Sie dieses Kontrollkästchen nur , wenn Sie Eingabedatensätze nach einem Feld gruppieren möchten, bevor Sie Cluster erstellen.Hinweis: Wenn Sie dieses Kontrollkästchen aktivieren, wird die Liste Gruppieren nach aktiviert. Wenn Sie das Kontrollkästchen nicht aktivieren, werden alle Tabellendatensätze in Cluster gruppiert. |
| Gruppieren nach |
Die Auswahl eines Werts aus dieser Liste ist optional. Wenn Sie dies tun, gruppiert das System Datensätze basierend auf Ihrer Auswahl in einem oder mehreren Clustern. |
| Reinheitsfelder |
Wählen Sie Felder aus Ihrer Tabelle aus, die dem System helfen können, die im Cluster am häufigsten vorkommende Klasse zu identifizieren. Wählen Sie in diesem Beispielszenario Kategorie und Zuweisungsgruppe.Name aus. |
| Filter |
Fügen Sie Filterbedingungen hinzu, die auf die Eingabefelddatensätze angewendet werden, die Sie in Ihre Cluster aufnehmen möchten.Hinweis: Die Anzahl der Datensätze für das Clustering ist auf 300.000 beschränkt. |
| Verarbeitungssprache |
Wählen Sie die dominante Sprache des Datensatzes aus, den Sie anhand der Lösungsdefinition trainieren. Wenn die Datensatzsprache Italienisch ist, wählen Sie Italienisch aus. Außerdem werden alle Datensätze standardmäßig auch in Englisch verarbeitet. Wenn Sie beispielsweise Italienisch auswählen, verarbeitet das System die Daten sowohl in Englisch als auch in Italienisch.Hinweis: Der Begriff Verarbeitung beinhaltet einige der sprachspezifischen Schritte, die im Rahmen des Trainings einer Lösung verwendet werden. Zum Beispiel das Versehen von Wörtern mit Token, das Entfernen von Stoppwörtern und die Wortstammerkennung. |
| Stoppwörter |
Nachdem Sie die Verarbeitungssprache ausgewählt haben, fügt das System automatisch eine Stoppwortliste in derselben Sprache hinzu. Wenn Ihre Verarbeitungssprache beispielsweise Italienisch ist, wird die Liste für standardmäßige italienische Stoppwörter angezeigt. Die Liste für standardmäßige englische Stoppwörter wird in Ihrer Auswahl auch angezeigt. Wenn Sie eine benutzerdefinierte Stoppwortliste erstellen, können Sie sie im Feld „Stoppwörter“ auswählen, um sie Ihrer Lösung hinzuzufügen. |
| Aktualisierungshäufigkeit |
Wählen Sie aus, wie oft das System Ihre Cluster mit neuen und aktualisierten Datensätzen aktualisieren soll. Hinweis: Das System ruft Datensätze basierend auf den Filterbedingungen „Gruppieren nach“ ab, die Sie ggf. in Ihrer Clustering-Lösung festgelegt haben.
Wenn Sie beispielsweise Alle 15 Minutenauswählen, ermittelt das System, welche Datensätze innerhalb dieses Zeitrahmens eingetroffen sind. Das System versucht, sie den vorhandenen Clustern zuzuweisen, oder erstellt nach Möglichkeit einen neuen Cluster.
In diesem Beispiel kommen 20 neue Datensätze. Wenn 16 dieser Datensätze in einen vorhandenen Cluster gelangen und 4 nicht, bildet das System einen neuen Cluster für die vier nicht zugewiesenen Datensätze.
Sie können auch festlegen, dass Ihre Cluster überhaupt nicht aktualisiert werden sollen. |
| Schulungshäufigkeit |
Wählen Sie aus, wie oft das System alle vorherigen Clusterergebnisse verwerfen und Cluster von Anfang an neu erstellen soll. Ihre Optionen reichen von täglich über jeden dritten bzw. siebten Tag bis zu monatlich. Sie können Ihren Cluster auch einmal trainieren.Hinweis: Der ML-Planer begrenzt die Anzahl der Schulungen, die eine Instanz innerhalb eines 24-Stunden-Fensters auf 50 neue ML-Trainingsanforderungen pro Instanz festlegen kann. Der Grenzwert schließt geplante Anforderungen für erneutes Trainieren aus. Darüber hinaus sind Clustering- und Ähnlichkeitsaktualisierungen auch dann von diesem Grenzwert ausgeschlossen, wenn die neuen Trainingsanforderungen innerhalb eines 24-Stunden-Fensters 50 überschreiten. |
| Mindestanzahl der Datensätze pro Cluster |
Geben Sie die Mindestanzahl von Datensätzen ein, die ein Cluster enthalten soll. Der eingegebene Wert muss größer oder gleich 2 sein. |