DatasetDefinition : global
L’API DatasetDefinition fournit des méthodes pour identifier un ensemble d’enregistrements comprenant un nom de table, des colonnes et des critères de sélection de ligne à utiliser comme entrée pour les algorithmes d’apprentissage ML. Les ensembles de données ne contiennent pas les données réelles.
Pour plus d’informations L’API nécessite le module d’extension Intelligence prédictive (com.glide.platform_ml) et est fournie dans l’espace de noms sn_ml . , consultez Intelligence prédictive.
Pour obtenir des instructions d’utilisation, consultez Utilisation des API ML.
DatasetDefinition : DatasetDefinition(Object)
Crée une instance de la classe DatasetDefinition , vous permettant de définir un jeu de données par nom de table, champs et requête.
Créez votre définition de jeu de données en transmettant une table et une liste de champs. Vous pouvez également transmettre une requête pour restreindre les jeux de données afin d’inclure des lignes avec des caractéristiques spécifiques.
Une fois créé, un objet DatasetDefinition ne peut pas être modifié.
| Nom | Type | Description |
|---|---|---|
| configuration | Objet | Objet JavaScript contenant les propriétés de définition du jeu de données. |
| config.tableName | Chaîne | Nom de la table pour l’ensemble de données. Par exemple, « tableName » : « Incident ». |
| config.fieldNames | Tableau | Facultatif. Liste des noms de champs de la table spécifiée en tant que chaînes. Par exemple, « fieldNames » : ["short_description », « priority"]. Par défaut : Tous les champs |
| config.fieldDetails | Tableau | Facultatif. Liste des objets JavaScript qui spécifient les propriétés du champ. Utilisez cette propriété pour forcer les algorithmes d’apprentissage machine à interpréter les champs comme étant d’un type spécifique. Vous n’avez pas besoin d’obtenir les détails de champ pour chaque champ répertorié dans la fieldNames propriété. Tous les détails doivent correspondre à un champ répertorié dans le fieldNames tableau. |
| config.fieldDetails.name | Chaîne | Nom du champ définissant le type d’informations auquel limiter cet ensemble de données. S’il est utilisé, ce nom de champ doit correspondre au nom correspondant répertorié dans la fieldNames propriété. |
| config.fieldDetails.type | Chaîne | Type de champ d’apprentissage machine. La spécification du type de données force le formateur ML à interpréter un champ comme ayant ce type. Si aucun type de données n’est spécifié, le système détermine le type. Types pris en charge :
Ces types identifient les types de données du point de vue de l’apprentissage machine. Le type ML peut différer du type répertorié dans la table source. Un champ peut être un type de chaîne, mais son but peut être de coder une valeur nominale. Par exemple, les tailles de t-shirts telles que « XL », « L » ou « M » sont des types de chaîne dans la table, mais chaque valeur représente une catégorie d’attribut nominal du point de vue ML. |
| config.encodedQuery | Chaîne | Facultatif. Chaîne de requête codée au format Glide standard. Reportez-vous à la section Chaînes de requêtes codées. Vous pouvez construire la requête pour qu’elle soit absolue ou relative. Par exemple, votre requête peut renvoyer des lignes pour les 3 mois précédents (relatif) ou pour la période de mai à juillet (absolu). Qu’il s’agisse d’un modèle absolu ou relatif, les données identifiées par une définition peuvent changer si les lignes de la table sous-jacente changent. |
L’exemple suivant montre comment créer une définition de jeu de données.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition : getEligibleFields(aptitude de chaîne)
Renvoie une liste de champs éligibles en tant que champs d’entrée (entités) ou champs prévus concernant une solution d’une option donnée, par exemple, une solution de classification. L’éligibilité est déterminée en fonction des champs ayant les types de données Glide appropriés.
| Nom | Type | Description |
|---|---|---|
| aptitude | Chaîne | Aptitude permettant de récupérer les champs éligibles à la formation. Cette méthode ne prend actuellement en charge que les solutions de classification, toute autre valeur pour l’option lève une exception « aptitude non prise en charge ». Valeurs valides : |
| Type | Description |
|---|---|
| Objet | Objet contenant des noms de champs d’entrée et de sortie éligibles. |
| <Object>.eligibleInputFieldNames | Liste des chaînes indiquant les champs d’entrée éligibles à la formation. Type de données : tableau |
| <Object>.eligibleOutputFieldNames | Liste de chaînes indiquant les champs de sortie éligibles à la formation. Type de données : tableau |
L’exemple suivant montre comment afficher les champs éligibles pour une solution de classification.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
Sortie :
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}