DatasetDefinition – Global
Identifiziert Eine Reihe von Datensätzen, einschließlich Tabellenname, Spalten und Zeilenauswahlkriterien, die als Eingabe für ML-Trainingsalgorithmen verwendet werden sollen. Datensätze enthalten nicht die tatsächlichen Daten.
Die DatasetDefinition Die API erfordert das Plugin Predictive Intelligence (com.glide.platform_ml) und wird im sn_ml- Namespace bereitgestellt. Weitere Informationen finden Sie unter Predictive Intelligence.
Richtlinien zur Verwendung finden Sie unter ML-APIsverwenden.
DatasetDefinition – DatasetDefinition(Object)
Erstellt eine Instanz der DatasetDefinition -Klasse, sodass Sie einen Datensatz nach Tabellenname, Feldern und Abfrage definieren können.
Erstellen Sie Ihre Datensatzdefinition, indem Sie eine Tabelle und eine Liste von Feldern übergeben. Sie können auch eine Abfrage übergeben, um Datensätze auf Zeilen mit bestimmten Merkmalen zu beschränken.
Nach der Erstellung kann ein DatasetDefinition-Objekt nicht mehr geändert werden.
| Name | Typ | Beschreibung |
|---|---|---|
| Konfiguration | Objekt | JavaScript-Objekt, das die Eigenschaften der Datensatzdefinition enthält. |
| config.tableName | Zeichenfolge | Name der Tabelle für den Datensatz. Beispiel: "tableName" : "Incident". |
| config.fieldNames | Array | Optional. Liste der Feldnamen aus der angegebenen Tabelle als Zeichenfolgen. Beispiel: „fieldNames“ : ["short_description", "priority"]. Standard: Alle Felder |
| config.fieldDetails | Array | Optional. Liste der JavaScript-Objekte, die Feldeigenschaften angeben. Verwenden Sie diese Eigenschaft, um ML-Algorithmen zu zwingen, Felder als einen bestimmten Typ zu interpretieren. Sie müssen nicht für jedes Feld, das in der Eigenschaft fieldNames aufgeführt ist, Felddetails abrufen. Alle Details müssen einem Feld entsprechen, das im Array fieldNames aufgeführt ist. |
| config.fieldDetails.name | Zeichenfolge | Name des Felds, das den Typ der Informationen definiert, auf die dieser Datensatz beschränkt werden soll. Wenn verwendet, muss dieser Feldname mit dem entsprechenden Namen übereinstimmen, der in der Eigenschaft fieldNames aufgeführt ist. |
| config.fieldDetails.type | Zeichenfolge | ML-Feldtyp (maschinelles Lernen). Durch die Angabe des Datentyps wird der ML-Trainer gezwungen, ein Feld mit diesem Typ zu interpretieren. Wenn kein Datentyp angegeben ist, bestimmt das System den Typ. Unterstützte Typen:
Diese Typen identifizieren Datentypen aus der Perspektive des maschinellen Lernens. Der ML-Typ kann sich von dem in der Quelltabelle aufgeführten Typ unterscheiden. Ein Feld kann ein Zeichenfolgentyp sein, sein Zweck kann jedoch darin bestehen, einen Nominalwert zu codieren. Zum Beispiel sind T-Shirt-Größen wie „XL“, „L“ oder „M“ Zeichenfolgentypen in der Tabelle, aber jeder Wert stellt eine Kategorie eines nominellen Attributs aus einer ML-Perspektive dar. |
| config.encodedQuery | Zeichenfolge | Optional. Codierte Abfragezeichenfolge im Standard-Glide-Format. Weitere Informationen finden Sie unter Codierte Abfragezeichenfolgen. Sie können die Abfrage absolut oder relativ erstellen. Beispielsweise kann Ihre Abfrage Zeilen für die letzten 3 Monate (relativ) oder für den Zeitraum Mai bis Juli (absolut) zurückgeben. Unabhängig davon, ob ein absolutes oder relatives Muster verwendet wird, können sich die von einer Definition identifizierten Daten ändern, wenn sich die Zeilen in der zugrunde liegenden Tabelle ändern. |
Das folgende Beispiel zeigt, wie eine Datensatzdefinition erstellt wird.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition – getEligibleFields(String capability)
Gibt eine Liste von Feldern zurück, die entweder als Eingabefelder (Funktionen) oder als vorhergesagte Felder für eine Lösung einer bestimmten Fähigkeit in Frage kommen, z. B. eine Klassifizierungslösung. Die Berechtigung wird basierend auf den Feldern mit den entsprechenden Glide-Datentypen bestimmt.
| Name | Typ | Beschreibung |
|---|---|---|
| Fähigkeit | Zeichenfolge | Fähigkeit, für die Felder abgerufen werden sollen, die für das Training geeignet sind. Diese Methode unterstützt derzeit nur Klassifizierungslösungen. Jeder andere Wert für die Fähigkeit löst die Ausnahme „Fähigkeit nicht unterstützt“ aus. Gültige Werte: |
| Typ | Beschreibung |
|---|---|
| Objekt | Objekt mit zulässigen Eingabefeldnamen und zulässigen Ausgabefeldnamen. |
| <Object>.eligibleInputFieldNames | Liste der Zeichenfolgen, die Eingabefelder angeben, die für das Training geeignet sind. Datentyp: Array |
| <Object>.eligibleOutputFieldNames | Liste der Zeichenfolgen, die Ausgabefelder angeben, die für das Training geeignet sind. Datentyp: Array |
Das folgende Beispiel zeigt, wie geeignete Felder für eine Klassifizierungslösung angezeigt werden.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
Ausgabe:
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}