Ähnlichkeitsdefinitionsformular
Verwenden Sie das Formular „Ähnlichkeitsdefinition“ in Compliance WorkspaceDient zum Erstellen einer Ähnlichkeitsdefinition für die Zuordnung der regulatorischen Compliance.
Formular „Ähnlichkeitsdefinition“
Eine Beschreibung der Feldwerte finden Sie in der folgenden Tabelle.| Feld | Beschreibung |
|---|---|
| Bezeichnung | Eindeutiger Name für die Ähnlichkeitslösung. |
| Name | Name der Ähnlichkeitslösung. Dieses Feld wird automatisch auf den vom System zugewiesenen Namen festgelegt, der Ihrem Wert für am ähnlichsten ist Bezeichnung Feld. |
| Wortkorpus | Vorhandener Wortkorpus, der für Ihre Lösung relevant ist. Wählen Sie für diesen Anwendungsfall aus Wortkorpus für Problemzuweisung Wortkorpus. Hinweis: Für Word-Korpora in Ähnlichkeitslösungen ist die Anzahl der Datensätze gemäß Tabelle auf 300.000 beschränkt. |
| Tabelle | Tabelle, die die Datensätze enthält, für die Sie trainieren möchten und für die Sie vorhersagen möchten. Wenn Sie einen Tabellenwert zuweisen, wird im Formular ein Link angezeigt. Der Link zeigt die Anzahl der Datensätze an, die Ihren aktuellen Bedingungen entsprechen. Für diesen Anwendungsfall wird das Feld automatisch auf [. Festgelegt |
| Felder | Feldtypen, die wahrscheinlich bei der Empfehlung der Bezugsvermerke helfen. Sie können die Spalten aus der Tabelle in auswählen Tabelle Feld, damit ihre Daten bei der genaueren Vorhersage der Bezugsvermerke helfen. In diesem Anwendungsfall wird Name , Dokumentname , Dokumentbeschreibung , Und Beschreibung Felder sind ausgewählt. Diese Felder sind die Feldtypen, die die Zitatdatensätze enthalten, die Sie empfehlen möchten. Hinweis: Sie können die hier ausgewählten Felder ändern, wenn sich andere nicht leere wichtige Felder im Problemdatensatz in Ihrer Datenbank befinden, sodass diese Felder bei der Suche nach ähnlichen Bezugsvermerken für die Zuordnung zu den regulatorischen Warnungen helfen können. |
| Testtabelle | Tabelle, die die Bezugsvermerke enthält, für die Sie vorhersagen möchten. Für diesen Anwendungsfall wird das Feld automatisch auf das Problem [. Festgelegt sn_grc_reg_change_regulatory_feed ] Tabelle.Hinweis: Die Anzahl der Datensätze, die das Ähnlichkeitsfenster abrufen kann, ist auf 10 beschränkt. Dieses Feld darf für diese Lösungsdefinition nicht geändert werden. |
| Testfelder | Felder, die während der Vorhersage als Eingabe verwendet werden. Wählen Sie in diesem Anwendungsfall aus Titel Und Beschreibung . Hinweis: Sie können die hier ausgewählten Felder ändern, wenn im Problemdatensatz in Ihrer Datenbank andere nicht leere wichtige Felder vorhanden sind, sodass diese Felder bei der Suche nach ähnlichen Problemen für die Vorhersage der Problembesitzer helfen können. |
| Filter | Lassen Sie dieses Feld leer. |
| Verarbeitungssprache | Dominante Sprache des Datensatzes, den Sie für die Lösungsdefinition trainieren. Wenn die Datensatzsprache Englisch ist, wählen Sie aus Englisch . Standardmäßig wird die englische Verarbeitung auf alle Datensätze angewendet. Beispiel: Wenn Sie auswählen Englisch , Das System verarbeitet die Daten sowohl in Englisch als auch in Italienisch. Hinweis: Die Bedingung Wird verarbeitet Gibt einige der sprachspezifischen Schritte an, die im Rahmen des Trainings einer Lösung verwendet werden. Diese Schritte umfassen das Tokenisieren von Wörtern, das Entfernen von Stoppwörtern und das Stemmming. |
| Stoppwörter | Liste der Stoppwörter. Wenn Sie Ihre Verarbeitungssprache auswählen, fügt das System automatisch eine Stoppwortliste hinzu, die dieselbe Sprache verwendet. Wenn Ihre Verarbeitungssprache beispielsweise Englisch ist, wird die verwendet Standardmäßige Englische Stoppwörter Option wird angezeigt. Die Liste standardmäßiger englischer Stoppwörter wird auch in Ihrer Auswahl angezeigt. Sie können Ihre eigene anwenderdefinierte Liste von Stoppwörtern hinzufügen. |
| Schulungshäufigkeit | Häufigkeit des Trainings. Die Option zum erneuten Trainieren kann 180 Tage betragen. |
| Aktualisierungshäufigkeit | Häufigkeit, mit der Sie die Daten aktualisieren möchten, die Sie zum Abrufen Ihrer Ähnlichkeitsergebnisse verwenden. Beispielsweise treten neue Bezugsvermerke in der Regel den ganzen Tag über häufig auf. Wenn Sie neue Bezugsvermerke haben, können Sie eine Aktualisierungshäufigkeit von auswählen Alle 15 Minuten . Diese Häufigkeit kann die Wahrscheinlichkeit erhöhen, dass neue Bezugsvermerke in die Aktualisierung aufgenommen werden. |