DatasetDefinition : global

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 4 minutes de lecture
  • Identifie un ensemble d’enregistrements comprenant un nom de table, des colonnes et des critères de sélection de lignes à utiliser comme entrée pour les algorithmes d’apprentissage ML. Les jeux de données ne contiennent pas les données réelles.

    DatasetDefinition L’API requiert le module d’extension Intelligence prédictive (com.glide.platform_ml) et est fournie dans l’espace de noms sn_ml . Pour plus d’informations, consultez Predictive Intelligence.

    Utilisez le jeu de données pour estimer la prévisibilité des informations mutuellesEstimer ou entraîner les données spécifiées par un encodeur. Vous pouvez également utiliser le jeu de données pour entraîner les données spécifiées par l’un des types de solutions suivants :

    Pour obtenir des instructions d’utilisation, reportez-vous à la section Utilisation des API ML.

    DatasetDefinition : DatasetDefinition(Object)

    Crée une instance de la classe DatasetDefinition , vous permettant de définir un jeu de données par nom de table, champs et requête.

    Créez votre définition de jeu de données en transmettant une table et une liste de champs. Vous pouvez également transmettre une requête pour restreindre les jeux de données afin d’inclure des lignes avec des caractéristiques spécifiques.

    Une fois créé, un objet DatasetDefinition ne peut pas être modifié.

    Tableau 1. Paramètres
    Nom Type Description
    configuration Objet Objet JavaScript contenant les propriétés de définition du jeu de données.
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    config.tableName Chaîne Nom de la table pour le jeu de données. Par exemple, « tableName » : « Incident ».
    config.fieldNames Tableau Facultatif. Liste de noms de champs de la table spécifiée en tant que chaînes. Par exemple, « fieldNames » : ["short_description », « priority"].

    Valeur par défaut : Tous les champs

    config.fieldDetails Tableau Facultatif. Liste des objets JavaScript qui spécifient les propriétés des champs.

    Utilisez cette propriété pour forcer les algorithmes d’apprentissage machine à interpréter les champs comme appartenant à un type spécifique. Vous n’avez pas besoin d’obtenir les détails pour chaque champ répertorié dans la fieldNames propriété. Tous les détails doivent correspondre à un champ répertorié dans le fieldNames tableau.

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name Chaîne Nom du champ définissant le type d’informations auquel restreindre cet ensemble de données. S’il est utilisé, ce nom de champ doit correspondre au nom correspondant répertorié dans la fieldNames propriété.
    type configuration.fieldDetails.type Chaîne Type de champ d’apprentissage machine. Spécifier le type de données force le formateur ML à interpréter un champ comme ayant ce type. Si aucun type de données n’est spécifié, le système détermine le type.
    Types pris en charge :
    • nominal: ML interprète ce champ comme contenant des classes ou des catégories.
    • numeric: ML interprète ce champ comme contenant des nombres.
    • text: ML interprète ce champ comme contenant du texte.

    Ces types identifient les types de données du point de vue de l’apprentissage machine. Le type ML peut différer du type répertorié dans la table source. Un champ peut être un type de chaîne, mais son but peut être de coder une valeur nominale. Par exemple, les tailles de t-shirts telles que « XL », « L » ou « M » sont des types de chaîne dans la table, mais chaque valeur représente une catégorie d’attribut nominal d’un point de vue ML.

    config.encodedQuery Chaîne Facultatif. Chaîne de requête codée au format Glide standard. Reportez-vous à la section Chaînes de requêtes codées.

    Vous pouvez construire la requête pour qu’elle soit absolue ou relative. Par exemple, votre requête peut renvoyer des lignes pour les 3 mois précédents (relatif) ou pour la période de mai à juillet (absolu). Qu’il s’agisse d’un modèle absolu ou relatif, les données identifiées par une définition peuvent changer si les lignes de la table sous-jacente changent.

    L’exemple suivant montre comment créer une définition de jeu de données.

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition : getEligibleFields (fonctionnalité de chaîne)

    Renvoie une liste de champs éligibles en tant que champs d’entrée (entités) ou champs prédits concernant une solution d’une option donnée, par exemple, une solution de classification. L’éligibilité est déterminée en fonction des champs ayant les types de données Glide appropriés.

    Tableau 2. Paramètres
    Nom Type Description
    aptitude Chaîne Aptitude pour laquelle récupérer les champs éligibles à la formation. Cette méthode ne prend actuellement en charge que les solutions de classification. Toute autre valeur pour l’aptitude lève une exception « aptitude non prise en charge ».

    Valeurs valides : « classification »

    Tableau 3. Renvoie
    Type Description
    Objet Objet contenant des noms de champs d’entrée éligibles et des noms de champs de sortie éligibles.
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.eligibleInputFieldNames Liste de chaînes indiquant les champs d’entrée éligibles à la formation.

    Type de données : tableau

    <Object>.eligibleOutputFieldNames Liste des chaînes indiquant les champs de sortie éligibles à la formation.

    Type de données : tableau

    L’exemple suivant montre comment afficher les champs éligibles pour une solution de classification.

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    Sortie :

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }