DatasetDefinition : Global

  • Freigeben Version: Xanadu
  • Aktualisiert 1. August 2024
  • 3 Minuten Lesedauer
  • Die DatasetDefinition- API bietet Methoden zum Identifizieren von Eine Reihe von Datensätzen, einschließlich eines Tabellennamens, Spalten und Zeilenauswahlkriterien, die als Eingabe für ML-Trainingsalgorithmen verwendet werden. Datensätze enthalten nicht die tatsächlichen Daten.

    Diese Die API erfordert das Plugin Predictive Intelligence (com.glide.platform_ml) und wird im Namespace sn_ml bereitgestellt. Weitere Informationen finden Sie unter Predictive Intelligence.

    Verwenden Sie den Datensatz, um gegenseitige Informationen zu schätzen, PredictabilityEstimate zu schätzen oder von einem Encoderangegebene trainierte Daten zu nutzen. Sie können den Datensatz auch verwenden, um Daten zu trainieren, die von einem der folgenden Lösungstypen angegeben werden:

    Richtlinien zur Verwendung finden Sie unter ML-APIsverwenden .

    DatasetDefinition: DatasetDefinition(Object)

    Erstellt eine Instanz der DatasetDefinition -Klasse, sodass Sie einen Datensatz anhand des Tabellennamens, der Felder und der Abfrage definieren können.

    Erstellen Sie Ihre Datensatzdefinition, indem Sie eine Tabelle und eine Liste von Feldern übergeben. Sie können auch eine Abfrage übergeben, um Datensätze auf Zeilen mit bestimmten Merkmalen zu beschränken.

    Nach der Erstellung kann ein DatasetDefinition-Objekt nicht mehr geändert werden.

    Tabelle : 1. Parameter
    Name Typ Beschreibung
    Konfiguration Objekt JavaScript-Objekt, das die Eigenschaften der Datensatzdefinition enthält.
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    config.tableName Zeichenfolge Name der Tabelle für den Datensatz. Beispiel: „tableName“ : „Incident“.
    config.fieldNames Array Optional. Liste der Feldnamen aus der angegebenen Tabelle als Zeichenfolgen. Beispiel: „fieldNames“ : ["short_description", "priority"].

    Standard: Alle Felder

    config.fieldDetails Array Optional. Liste von JavaScript-Objekten, die Feldeigenschaften angeben.

    Verwenden Sie diese Eigenschaft, um Algorithmen für maschinelles Lernen zu erzwingen, um Felder als einen bestimmten Typ zu interpretieren. Sie müssen Felddetails nicht für jedes Feld abrufen, das in der Eigenschaft fieldNames aufgeführt ist. Alle Details müssen einem Feld entsprechen, das im Array fieldNames aufgeführt ist.

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name Zeichenfolge Name des Felds, das die Art der Informationen definiert, auf die dieser Datensatz beschränkt werden soll Bei Verwendung muss dieser Feldname mit dem entsprechenden Namen übereinstimmen, der in der Eigenschaft fieldNames aufgeführt ist.
    config.fieldDetails.type Zeichenfolge Feldtyp für maschinelles Lernen. Wenn Sie den Datentyp angeben, wird der ML-Trainer gezwungen, ein Feld als diesen Typ aufweisend zu interpretieren. Wenn kein Datentyp angegeben ist, bestimmt das System den Typ.
    Unterstützte Typen:
    • nominal: ML interpretiert dieses Feld als Klassen oder Kategorien enthaltend.
    • numeric: ML interpretiert dieses Feld als Zahlen enthaltend.
    • text: ML interpretiert dieses Feld als Text enthaltend.

    Diese Typen identifizieren Datentypen aus der Perspektive des maschinellen Lernens. Der ML-Typ kann sich von dem in der Quelltabelle aufgeführten Typ unterscheiden. Ein Feld kann vom Typ „Zeichenfolge“ sein, sein Zweck kann jedoch sein, einen Nominalwert zu codieren. Beispielsweise sind T-Shirt-Größen wie „XL“, „L“ oder „M“ Zeichenfolgentypen in der Tabelle, aber jeder Wert stellt eine Kategorie eines Nominalattributs aus einer ML-Perspektive dar.

    config.encodedQuery Zeichenfolge Optional. Codierte Abfragezeichenfolge im Standard-Glide-Format. Siehe Codierte Abfragezeichenfolgen.

    Sie können die Abfrage absolut oder relativ erstellen. Beispielsweise kann Ihre Abfrage Zeilen für die letzten 3 Monate (relativ) oder für den Zeitraum Mai bis Juli (absolut) zurückgeben. Unabhängig davon, ob ein absolutes oder ein relatives Muster verwendet wird, können sich die Daten, die eine Definition identifiziert, ändern, wenn sich die Zeilen in der zugrunde liegenden Tabelle ändern.

    Das folgende Beispiel zeigt, wie eine Datensatzdefinition erstellt wird.

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition – getEligibleFields(String capability)

    Gibt eine Liste von Feldern zurück, die entweder als Eingabefelder (Funktionen) oder als vorhergesagte Felder für eine Lösung einer bestimmten Fähigkeit geeignet sind, z. B. eine Klassifizierungslösung. Die Berechtigung wird basierend auf den Feldern mit den entsprechenden Glide-Datentypen bestimmt.

    Tabelle : 2. Parameter
    Name Typ Beschreibung
    Fähigkeit Zeichenfolge Fähigkeit, für die für das Training in Frage kommende Felder abgerufen werden sollen. Diese Methode unterstützt derzeit nur Klassifizierungslösungen. Jeder andere Wert für die Fähigkeit löst die Ausnahme „Fähigkeit nicht unterstützt“ aus.

    Gültige Werte: „classification“

    Tabelle : 3. Ergebnisse
    Typ Beschreibung
    Objekt Objekt mit berechtigten Eingabefeldnamen und berechtigten Ausgabefeldnamen.
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.berechtigteEingabeFeldNamen Liste von Zeichenfolgen, die angeben, welche Eingabefelder für das Training in Frage kommen.

    Datentyp: Array

    <Object>.berechtigteAusgabeFeldNamen Liste von Zeichenfolgen, die angeben, welche Ausgabefelder für das Training in Frage kommen.

    Datentyp: Array

    Das folgende Beispiel zeigt, wie in Frage kommende Felder für eine Klassifizierungslösung angezeigt werden.

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    Ausgabe:

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }