DatasetDefinition – Global

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 3 Minuten Lesedauer
  • Identifiziert Eine Reihe von Datensätzen, einschließlich Tabellenname, Spalten und Zeilenauswahlkriterien, die als Eingabe für ML-Trainingsalgorithmen verwendet werden sollen. Datensätze enthalten nicht die tatsächlichen Daten.

    Die DatasetDefinition Die API erfordert das Plugin Predictive Intelligence (com.glide.platform_ml) und wird im sn_ml- Namespace bereitgestellt. Weitere Informationen finden Sie unter Predictive Intelligence.

    Verwenden Sie den Datensatz, um gegenseitige Informationen PredictabilityEstimate zu schätzen oder von einem Encoderangegebene Daten zu trainieren. Sie können den Datensatz auch zum Trainieren von Daten verwenden, die von einem der folgenden Lösungstypen angegeben werden:

    Richtlinien zur Verwendung finden Sie unter ML-APIsverwenden.

    DatasetDefinition – DatasetDefinition(Object)

    Erstellt eine Instanz der DatasetDefinition -Klasse, sodass Sie einen Datensatz nach Tabellenname, Feldern und Abfrage definieren können.

    Erstellen Sie Ihre Datensatzdefinition, indem Sie eine Tabelle und eine Liste von Feldern übergeben. Sie können auch eine Abfrage übergeben, um Datensätze auf Zeilen mit bestimmten Merkmalen zu beschränken.

    Nach der Erstellung kann ein DatasetDefinition-Objekt nicht mehr geändert werden.

    Tabelle : 1. Parameter
    Name Typ Beschreibung
    Konfiguration Objekt JavaScript-Objekt, das die Eigenschaften der Datensatzdefinition enthält.
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    config.tableName Zeichenfolge Name der Tabelle für den Datensatz. Beispiel: "tableName" : "Incident".
    config.fieldNames Array Optional. Liste der Feldnamen aus der angegebenen Tabelle als Zeichenfolgen. Beispiel: „fieldNames“ : ["short_description", "priority"].

    Standard: Alle Felder

    config.fieldDetails Array Optional. Liste der JavaScript-Objekte, die Feldeigenschaften angeben.

    Verwenden Sie diese Eigenschaft, um ML-Algorithmen zu zwingen, Felder als einen bestimmten Typ zu interpretieren. Sie müssen nicht für jedes Feld, das in der Eigenschaft fieldNames aufgeführt ist, Felddetails abrufen. Alle Details müssen einem Feld entsprechen, das im Array fieldNames aufgeführt ist.

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name Zeichenfolge Name des Felds, das den Typ der Informationen definiert, auf die dieser Datensatz beschränkt werden soll. Wenn verwendet, muss dieser Feldname mit dem entsprechenden Namen übereinstimmen, der in der Eigenschaft fieldNames aufgeführt ist.
    config.fieldDetails.type Zeichenfolge ML-Feldtyp (maschinelles Lernen). Durch die Angabe des Datentyps wird der ML-Trainer gezwungen, ein Feld mit diesem Typ zu interpretieren. Wenn kein Datentyp angegeben ist, bestimmt das System den Typ.
    Unterstützte Typen:
    • nominal: ML interpretiert dieses Feld als Klassen oder Kategorien enthaltend.
    • numeric: ML interpretiert dieses Feld als Zahlen enthaltend.
    • text: ML interpretiert dieses Feld als Text enthaltend.

    Diese Typen identifizieren Datentypen aus der Perspektive des maschinellen Lernens. Der ML-Typ kann sich von dem in der Quelltabelle aufgeführten Typ unterscheiden. Ein Feld kann ein Zeichenfolgentyp sein, sein Zweck kann jedoch darin bestehen, einen Nominalwert zu codieren. Zum Beispiel sind T-Shirt-Größen wie „XL“, „L“ oder „M“ Zeichenfolgentypen in der Tabelle, aber jeder Wert stellt eine Kategorie eines nominellen Attributs aus einer ML-Perspektive dar.

    config.encodedQuery Zeichenfolge Optional. Codierte Abfragezeichenfolge im Standard-Glide-Format. Weitere Informationen finden Sie unter Codierte Abfragezeichenfolgen.

    Sie können die Abfrage absolut oder relativ erstellen. Beispielsweise kann Ihre Abfrage Zeilen für die letzten 3 Monate (relativ) oder für den Zeitraum Mai bis Juli (absolut) zurückgeben. Unabhängig davon, ob ein absolutes oder relatives Muster verwendet wird, können sich die von einer Definition identifizierten Daten ändern, wenn sich die Zeilen in der zugrunde liegenden Tabelle ändern.

    Das folgende Beispiel zeigt, wie eine Datensatzdefinition erstellt wird.

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition – getEligibleFields(String capability)

    Gibt eine Liste von Feldern zurück, die entweder als Eingabefelder (Funktionen) oder als vorhergesagte Felder für eine Lösung einer bestimmten Fähigkeit in Frage kommen, z. B. eine Klassifizierungslösung. Die Berechtigung wird basierend auf den Feldern mit den entsprechenden Glide-Datentypen bestimmt.

    Tabelle : 2. Parameter
    Name Typ Beschreibung
    Fähigkeit Zeichenfolge Fähigkeit, für die Felder abgerufen werden sollen, die für das Training geeignet sind. Diese Methode unterstützt derzeit nur Klassifizierungslösungen. Jeder andere Wert für die Fähigkeit löst die Ausnahme „Fähigkeit nicht unterstützt“ aus.

    Gültige Werte: „classification“

    Tabelle : 3. Ergebnisse
    Typ Beschreibung
    Objekt Objekt mit zulässigen Eingabefeldnamen und zulässigen Ausgabefeldnamen.
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.eligibleInputFieldNames Liste der Zeichenfolgen, die Eingabefelder angeben, die für das Training geeignet sind.

    Datentyp: Array

    <Object>.eligibleOutputFieldNames Liste der Zeichenfolgen, die Ausgabefelder angeben, die für das Training geeignet sind.

    Datentyp: Array

    Das folgende Beispiel zeigt, wie geeignete Felder für eine Klassifizierungslösung angezeigt werden.

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    Ausgabe:

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }