DatasetDefinition : global
L’API DatasetDefinition fournit des méthodes pour identifier un ensemble d’enregistrements comprenant un nom de table, des colonnes et des critères de sélection de ligne à utiliser comme entrée pour les algorithmes d’entraînement ML. Les jeux de données ne contiennent pas les données réelles.
Ceci L’API nécessite le module d’extension Intelligence prédictive (com.glide.platform_ml) et est fournie dans l’espace de noms sn_ml . : Pour plus d’informations, consultez Intelligence prédictive.
Pour connaître des directives d’utilisation, reportez-vous à la section Utilisation des API ML.
DatasetDefinition : DatasetDefinition(Objet)
Crée une instance de la classe DatasetDefinition , qui vous permet de définir un ensemble de données par nom de table, champs et requête.
Créez votre définition d’ensemble de données en transmettant une table et une liste de champs. Vous pouvez également transmettre une requête pour restreindre les jeux de données afin d’inclure des lignes avec des caractéristiques spécifiques.
Une fois créé, un objet DatasetDefinition ne peut pas être modifié.
| Nom | Type | Description |
|---|---|---|
| configuration | Objet | Objet JavaScript contenant les propriétés de définition du jeu de données. |
| config.tableName | Chaîne | Nom de la table de l’ensemble de données. Par exemple, « tableName » : « Incident ». |
| config.fieldNames | Tableau | Facultatif. Liste des noms de champs de la table spécifiée sous forme de chaînes. Par exemple, « fieldNames » : ["short_description », « priority"]. Par défaut : Tous les champs |
| config.fieldDetails | Tableau | Facultatif. Liste des objets JavaScript qui spécifient les propriétés des champs. Utilisez cette propriété pour forcer les algorithmes d’apprentissage machine à interpréter les champs comme étant un type spécifique. Vous n’avez pas besoin d’obtenir les détails des champs pour chaque champ répertorié dans la fieldNames propriété. Tous les détails doivent correspondre à un champ répertorié dans le fieldNames tableau. |
| config.fieldDetails.name | Chaîne | Nom du champ définissant le type d’informations auquel restreindre cet ensemble de données. S’il est utilisé, ce nom de champ doit correspondre au nom correspondant répertorié dans la fieldNames propriété. |
| config.fieldDetails.type | Chaîne | Type de champ d’apprentissage machine. La spécification du type de données force le formateur ML à interpréter un champ comme ayant ce type. Si aucun type de données n’est spécifié, le système détermine le type. Types pris en charge :
Ces types identifient les types de données du point de vue de l’apprentissage machine. Le type ML peut différer du type répertorié dans la table source. Un champ peut être de type chaîne, mais son but peut être de coder une valeur nominale. Par exemple, les tailles de t-shirt telles que « XL », « L » ou « M » sont des types de chaîne dans la table, mais chaque valeur représente une catégorgie d’un attribut nominal d’un point de vue ML. |
| config.encodedQuery | Chaîne | Facultatif. Chaîne de requête codée au format Glide standard. Voir Chaînes de requête codées. Vous pouvez construire la requête pour qu’elle soit absolue ou relative. Par exemple, votre requête peut renvoyer des lignes pour les 3 mois précédents (relatif) ou pour la période de mai à juillet (absolue). Que vous utilisiez un modèle absolu ou relatif, les données identifiées par une définition peuvent changer si les lignes de la table sous-jacente changent. |
L’exemple suivant montre comment créer une définition de jeu de données.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition : getEligibleFields(aptitude de chaîne)
Renvoie une liste de champs éligibles en tant que champs d’entrée (fonctionnalités) ou champs prédits concernant une solution d’une option donnée, par exemple, une solution de classification. L’éligibilité est déterminée en fonction des champs ayant les types de données Glide appropriés.
| Nom | Type | Description |
|---|---|---|
| aptitude | Chaîne | Aptitude pour laquelle récupérer les champs éligibles à la formation. Cette méthode ne prend actuellement en charge que les solutions de classification, toute autre valeur pour l’aptitude lève une exception « aptitude non prise en charge ». Valeurs valides : |
| Type | Description |
|---|---|
| Objet | Objet contenant les noms de champs d’entrée et de sortie éligibles. |
| <Object>.eligibleInputFieldNames | Liste de chaînes indiquant les champs d’entrée éligibles à la formation. Type de données : tableau |
| <Object>.eligibleOutputFieldNames | Liste de chaînes indiquant les champs de sortie éligibles à la formation. Type de données : tableau |
L’exemple suivant montre comment afficher les champs éligibles pour une solution de classification.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
Sortie :
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}