Datendefinition – Global

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 3 Minuten Lesedauer
  • Die Datendefinition Die API stellt Methoden zur Identifizierung bereit Eine Reihe von Datensätzen, einschließlich Tabellenname, Spalten und Zeilenauswahlkriterien, die als Eingabe für ML-Trainingsalgorithmen verwendet werden sollen. Datensätze enthalten nicht die tatsächlichen Daten.

    Dies API erfordert Predictive Intelligence Plugin (com.glide.platform_ml) und wird in bereitgestellt sn_ml Namespace. Informationen finden Sie unter Predictive Intelligence .

    Verwenden Sie den Datensatz, um gegenseitige Informationen zu schätzen VorhersageabilitätEstimate Oder Trainingsdaten, die von angegeben werden Encoder . Sie können den Datensatz auch verwenden, um Daten zu trainieren, die von einem der folgenden Lösungstypen angegeben werden:

    Nutzungsrichtlinien finden Sie unter Mit ML APIs .

    DatasetDefinition – DatasetDefinition (Objekt)

    Erstellt eine Instanz von Datendefinition Klasse, mit der Sie einen Datensatz nach Tabellenname, Feldern und Abfrage definieren können.

    Erstellen Sie Ihre Datensatzdefinition, indem Sie eine Tabelle und eine Liste von Feldern übergeben. Sie können auch eine Abfrage übergeben, um Datensätze so einzuschränken, dass sie Zeilen mit bestimmten Merkmalen enthalten.

    Nach der Erstellung kann ein DatasetDefinition-Objekt nicht geändert werden.

    Tabelle : 1. Parameter
    Name Typ Beschreibung
    Konfiguration Objekt JavaScript-Objekt, das die Eigenschaften der Datenbasisdefinition enthält.
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    Config.tableName Zeichenfolge Name der Tabelle für den Datensatz. Beispiel: „Tabellenname“: „Incident“ .
    Config.Feldnamen Array Optional. Liste der Feldnamen aus der angegebenen Tabelle als Zeichenfolgen. Beispiel: „Feldnamen“: [„short_description“, „Priorität“] .

    Standard: Alle Felder

    Config.fieldDetails Array Optional. Liste der JavaScript-Objekte, die Feldeigenschaften angeben.

    Verwenden Sie diese Eigenschaft, um Algorithmen für maschinelles Lernen zu erzwingen, Felder als einen bestimmten Typ zu interpretieren. Sie müssen nicht Felddetails für jedes Feld abrufen, das in aufgeführt ist fieldNamesEigenschaft. Alle Details müssen einem Feld entsprechen, das in aufgeführt ist fieldNamesArray.

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name Zeichenfolge Name des Felds, das den Typ der Informationen definiert, auf die dieser Datensatz beschränkt werden soll.Bei Verwendung muss dieser Feldname mit dem entsprechenden Namen übereinstimmen, der in aufgeführt ist fieldNamesEigenschaft.
    Config.fieldDetails.type Zeichenfolge Feldtyp für maschinelles Lernen. Durch Angabe des Datentyps wird der ML-Trainer gezwungen, ein Feld mit diesem Typ zu interpretieren. Wenn kein Datentyp angegeben ist, bestimmt das System den Typ.
    Unterstützte Typen:
    • nominal: ML interpretiert dieses Feld so, dass es Klassen oder Kategorien enthält.
    • numeric: ML interpretiert dieses Feld als enthält Zahlen.
    • text: ML interpretiert dieses Feld als Text enthaltenden Text.

    Diese Typen identifizieren Datentypen aus einer Perspektive für maschinelles Lernen. Der ML-Typ kann sich von dem in der Quelltabelle aufgeführten Typ unterscheiden. Ein Feld kann ein Zeichenfolgentyp sein, aber sein Zweck kann darin bestehen, einen Nennwert zu codieren. Beispielsweise sind T-Shirt-Größen wie „XL“, „L“ oder „M“ Zeichenfolgentypen in der Tabelle, aber jeder Wert stellt eine Kategorie eines nominalen Attributs aus ML-Perspektive dar.

    Config.encodedQuery Zeichenfolge Optional. Codierte Abfragezeichenfolge im Standard-Glide-Format. Siehe Codierte Abfragezeichenfolgen .

    Sie können die Abfrage als absolut oder relativ erstellen. Beispielsweise kann Ihre Abfrage Zeilen für die letzten 3 Monate (relativ) oder für den Zeitraum von Mai bis Juli (absolut) zurückgeben. Unabhängig davon, ob ein absolutes oder relatives Muster verwendet wird, können sich die Daten, die eine Definition identifiziert, ändern, wenn sich die Zeilen in der zugrunde liegenden Tabelle ändern.

    Das folgende Beispiel zeigt, wie Sie eine Datensatzdefinition erstellen.

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition – getEligibleFields(Zeichenfolgenfähigkeit)

    Gibt eine Liste von Feldern zurück, die entweder als Eingabefelder (Funktionen) oder vorhergesagte Felder in Bezug auf eine Lösung einer bestimmten Fähigkeit, z. B. eine Klassifizierungslösung, geeignet sind. Die Berechtigung wird basierend auf den Feldern mit den entsprechenden Glide-Datentypen bestimmt.

    Tabelle : 2. Parameter
    Name Typ Beschreibung
    Fähigkeit Zeichenfolge Fähigkeit, für die Felder abgerufen werden können, die für Schulungen geeignet sind. Diese Methode unterstützt derzeit nur Klassifizierungslösungen. Jeder andere Wert für die Fähigkeit löst die Ausnahme „Fähigkeit nicht unterstützt“ aus.

    Gültige Werte: „Klassifizierung“

    Tabelle : 3. Rückgaben
    Typ Beschreibung
    Objekt Objekt mit berechtigten Eingabefeldnamen und berechtigten Ausgabefeldnamen.
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.BerechtigungInputFieldNames Liste von Zeichenfolgen, die angeben, dass Eingabefelder für das Training geeignet sind.

    Datentyp: Array

    <Object>.BerechtigungOutputFieldNames Liste der Zeichenfolgen, die angeben, dass Ausgabefelder für das Training geeignet sind.

    Datentyp: Array

    Das folgende Beispiel zeigt, wie berechtigte Felder für eine Klassifizierungslösung angezeigt werden.

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    Ausgabe:

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }