DatasetDefinition : Global
Die DatasetDefinition -API bietet Methoden zum Identifizieren von Eine Reihe von Datensätzen, einschließlich eines Tabellennamens, Spalten und Zeilenauswahlkriterien, die als Eingabe für ML-Trainingsalgorithmen verwendet werden. Datensätze enthalten nicht die tatsächlichen Daten.
Diese Die API erfordert das Plugin Predictive Intelligence (com.glide.platform_ml) und wird im Namespace sn_ml bereitgestellt. Weitere Informationen finden Sie unter Predictive Intelligence.
Richtlinien zur Verwendung finden Sie unter ML-APIs verwenden.
DatasetDefinition: DatasetDefinition(Object)
Erstellt eine Instanz der DatasetDefinition- Klasse, sodass Sie einen Datensatz anhand des Tabellennamens, der Felder und der Abfrage definieren können.
Erstellen Sie Ihre Datensatzdefinition, indem Sie eine Tabelle und eine Liste von Feldern übergeben. Sie können auch eine Abfrage übergeben, um Datensätze auf Zeilen mit bestimmten Merkmalen zu beschränken.
Nach der Erstellung kann ein DatasetDefinition-Objekt nicht mehr geändert werden.
| Name | Typ | Beschreibung |
|---|---|---|
| Konfiguration | Objekt | JavaScript-Objekt, das die Eigenschaften der Datensatzdefinition enthält. |
| config.tableName | Zeichenfolge | Name der Tabelle für den Datensatz. Beispiel: „tableName“ : „Incident“. |
| config.fieldNames | Array | Optional. Liste der Feldnamen aus der angegebenen Tabelle als Zeichenfolgen. Beispiel: „fieldNames“ : ["short_description", "priority"]. Standard: Alle Felder |
| config.fieldDetails | Array | Optional. Liste von JavaScript-Objekten, die Feldeigenschaften angeben. Verwenden Sie diese Eigenschaft, um Algorithmen für maschinelles Lernen zu erzwingen, um Felder als einen bestimmten Typ zu interpretieren. Sie müssen Felddetails nicht für jedes Feld abrufen, das in der Eigenschaft fieldNames aufgeführt ist. Alle Details müssen einem Feld entsprechen, das im Array fieldNames aufgeführt ist. |
| config.fieldDetails.name | Zeichenfolge | Name des Felds, das die Art der Informationen definiert, auf die dieser Datensatz beschränkt werden soll Bei Verwendung muss dieser Feldname mit dem entsprechenden Namen übereinstimmen, der in der Eigenschaft fieldNames aufgeführt ist. |
| config.fieldDetails.type | Zeichenfolge | Feldtyp für maschinelles Lernen. Wenn Sie den Datentyp angeben, wird der ML-Trainer gezwungen, ein Feld als diesen Typ aufweisend zu interpretieren. Wenn kein Datentyp angegeben ist, bestimmt das System den Typ. Unterstützte Typen:
Diese Typen identifizieren Datentypen aus der Perspektive des maschinellen Lernens. Der ML-Typ kann sich von dem in der Quelltabelle aufgeführten Typ unterscheiden. Ein Feld kann vom Typ „Zeichenfolge“ sein, sein Zweck kann jedoch sein, einen Nominalwert zu codieren. Beispielsweise sind T-Shirt-Größen wie „XL“, „L“ oder „M“ Zeichenfolgentypen in der Tabelle, aber jeder Wert stellt eine Kategorie eines Nominalattributs aus einer ML-Perspektive dar. |
| config.encodedQuery | Zeichenfolge | Optional. Codierte Abfragezeichenfolge im Standard-Glide-Format. Siehe Codierte Abfragezeichenfolgen. Sie können die Abfrage absolut oder relativ erstellen. Beispielsweise kann Ihre Abfrage Zeilen für die letzten 3 Monate (relativ) oder für den Zeitraum Mai bis Juli (absolut) zurückgeben. Unabhängig davon, ob ein absolutes oder ein relatives Muster verwendet wird, können sich die Daten, die eine Definition identifiziert, ändern, wenn sich die Zeilen in der zugrunde liegenden Tabelle ändern. |
Das folgende Beispiel zeigt, wie eine Datensatzdefinition erstellt wird.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition – getEligibleFields(String capability)
Gibt eine Liste von Feldern zurück, die entweder als Eingabefelder (Funktionen) oder als vorhergesagte Felder für eine Lösung einer bestimmten Fähigkeit geeignet sind, z. B. eine Klassifizierungslösung. Die Berechtigung wird basierend auf den Feldern mit den entsprechenden Glide-Datentypen bestimmt.
| Name | Typ | Beschreibung |
|---|---|---|
| Fähigkeit | Zeichenfolge | Fähigkeit, für die für das Training in Frage kommende Felder abgerufen werden sollen. Diese Methode unterstützt derzeit nur Klassifizierungslösungen. Jeder andere Wert für die Fähigkeit löst die Ausnahme „Fähigkeit nicht unterstützt“ aus. Gültige Werte: |
| Typ | Beschreibung |
|---|---|
| Objekt | Objekt mit berechtigten Eingabefeldnamen und berechtigten Ausgabefeldnamen. |
| <Object>.berechtigteEingabeFeldNamen | Liste von Zeichenfolgen, die angeben, welche Eingabefelder für das Training in Frage kommen. Datentyp: Array |
| <Object>.berechtigteAusgabeFeldNamen | Liste von Zeichenfolgen, die angeben, welche Ausgabefelder für das Training in Frage kommen. Datentyp: Array |
Das folgende Beispiel zeigt, wie in Frage kommende Felder für eine Klassifizierungslösung angezeigt werden.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
Ausgabe:
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}