ClusteringSolution - Global

Référence API de Washington DC

Release

washingtondc

ft:locale

fr-FR

ft:publication_title

Référence API de Washington DC

ft:clusterId

crapiref

bundleId

crapiref

workflow

Creator

ClusteringSolution - Global

Rversion finale: Washingtondc

Mis à jour 1 févr. 2024

13 minutes de lecture

L’API ClusteringSolution est un objet pouvant contenir des scripts utilisé dans les Intelligence prédictive magasins.

Ce L’API requiert le module d’extension Intelligence prédictive (com.glide.platform_ml) et est fournie dans l’espace de noms sn_ml .

Le flux de configuration de la solution à la formation est le suivant :

Créez un jeu de données à l’aide de l’API DatasetDefinition .
Obligatoire si vous utilisez l’algorithme de clustering K-means. Créez un encodeur à l’aide de l’API Encoder .
Utilisez le constructeur pour créer un objet de solution de mise en grappe.
Ajoutez l’objet de solution au magasin de solutions de clustering à l’aide de la méthode ClusteringSolutionStore - add().
Entraînez la solution à l’aide de la méthode submitTrainingJob(). Cela crée une version de l’objet que vous pouvez gérer à l’aide de l’API ClusteringSolutionVersion .
Obtenir des prédictions à l’aide de la méthode ClusteringSolutionVersion – predict().

Remarque :

Cette API s’exécute avec tous les privilèges. Pour restreindre l’accès des utilisateurs, incluez un mécanisme de contrôle d’accès dans le script.

Pour obtenir des instructions d’utilisation, reportez-vous à la section Utilisation des API ML.

ClusteringSolution : ClusteringSolution(configuration de l’objet)

Crée une solution de grappe.

Tableau 1. Paramètres
Nom	Type	Description
configuration	Objet	Objet JavaScript contenant les propriétés de configuration de l’attribut Solution. `{ "algorithmConfig": {Object}, "clusterConcept": "String", "clusterConceptFieldNames": [Array], "dataset": {Object}, "domainName": "String", "encoder": {Object}, "groupByFieldName": "String", "groupUnclusteredRecords": Boolean, "inputFieldNames": [Array], "label": "String", "maxTimeWindowForUpdate" : Number, "minRecordsPerCluster" : Number, "minRowCount": "String", "processingLanguage": "String", "stopwords": [Array], "trainingFrequency": "String", "updateFrequency": "String" }`
config.algorithmConfig	Objet	Nécessaire sauf si la encoder propriété est définie. Objet JavaScript contenant les propriétés de configuration de l’algorithme. Les paramètres de propriété varient en fonction de la valeur définie dans la algorithm propriété. `'algorithmConfig': { "algorithm": "String", // See algorithmConfig.algorithm setting description for property settings based on algorithm }`
config.algorithmConfig.algorithm	Chaîne	Méthode de codage de votre solution. Valeurs valides : dbscan – Algorithme de clustering DBSCAN (Density-Based Spatial Clustering of Applications with Noise). Propriétés utilisées avec cet algorithme : distanceMetric epsilon minimumNeighbours hdbscan – Algorithme de clustering Hierarchical Density Based Spatial Clustering of Applications with Noise (HDBSCAN). Propriétés utilisées avec cet algorithme : minimumSamples kmeans – Algorithme de clustering K-means. Par défaut. La targetCoverage propriété est utilisée avec cet algorithme. Certains utilisateurs préfèrent DBSCAN, car il ne vous oblige pas à spécifier le nombre de clusters dans les données avant le clustering. Propriétés pour dbscan: `'algorithmConfig': { "algorithm": "dbscan", "distanceMetric": "String", "epsilon": Number, "minimumNeighbours": Number }` Propriétés pour hdbscan: `'algorithmConfig': { "algorithm": "hdbscan", "minimumSamples": Number }` Propriétés pour kmeans: `'algorithmConfig': { "algorithm": "kmeans", "targetCoverage": Number }`
config.algorithmConfig.distanceMetric	Chaîne	Algorithme DBSCAN uniquement. Mesure de distance à analyser pour rechercher des objets de données similaires. Valeurs valides : levenshteinDistance
config.algorithmConfig.epsilon	Numéro	Algorithme DBSCAN uniquement. Valeur décimale comprise entre 0 et 1 représentant la taille du rayon de recherche du quartier.
config.algorithmConfig.minimumNeighbours	Numéro	Algorithme DBSCAN uniquement. Nombre minimum de voisins requis dans un point pour faire partie d’une grappe. En effet levenshteinDistance , la valeur doit être 1 afin qu’aucun point ne soit exclu du jeu de données.
config.algorithmConfig.minimumSamples	Numéro	Nombre minimal d’échantillons de données dans un voisinage requis pour déterminer si un point est un point central. Par défaut : Aucun
config.algorithmConfig.targetCoverage	Numéro	K-signifie uniquement l’algorithme. Champ de centile pour filtrer les enregistrements qui sont moins similaires les uns aux autres.
config.clusterConcept	Chaîne	Facultatif. Type de concept. Un concept est un ensemble de mots répertoriés par ordre décroissant de fréquence. Pour générer un concept de cluster basé sur TFIDF, définissez la valeur sur `tfidf`. Les types de concepts sont répertoriés dans la table Définitions de mise en grappe [ml_capability_definition_clustering]. Par défaut : concept de cluster basé sur la fréquence
config.clusterConceptFieldNames	Tableau	Facultatif. Liste des noms de champs de concept de grappe. Ces valeurs sont des colonnes externes pour la création d’un concept de grappe et ne sont pas utilisées pour la formation de solutions de grappe. Si des colonnes externes sont fournies, elles ne sont utilisées que pour le concept de grappe et non pour la formation de solutions de mise en grappe. Les champs de concept de grappe sont répertoriés dans la table Définitions de grappe [ml_capability_definition_clustering]. Par défaut : les colonnes de texte d’entrée génèrent le concept de grappe
config.dataset	Objet	Nom de l’objet DatasetDefinition.
config.domainName	Chaîne	Facultatif. Nom de domaine associé à cet ensemble de données. Reportez-vous aux sections Domain separation et Intelligence prédictive. Par défaut : domaine actuel, par exemple, `« global ».`
config.encoder	Objet	Nécessaire sauf si la algorithmConfig propriété est définie sur `« levenshteinDistance ».` Objet de codeur formé à affecter à cette solution. Reportez-vous à Encodeur - Encodeur (configuration d’objet).
config.groupByFieldName	Chaîne	Facultatif. Nom de champ par lequel le système regroupe les enregistrements en une ou plusieurs grappes. Dans l’exemple de configuration suivant, le système regroupe chaque type dans une grappe individuelle, soit 10 grappes. groupByFieldName La valeur est `« catégorie »` La valeur de DatasetDefinition tableName est `« incident »` La table Incident [incident] comporte 10 types de catégories
config.groupUnclusteredRecords	Booléen	Marqueur indiquant s’il faut regrouper des enregistrements non groupés dans les résultats. Valeurs valides : true : regrouper les enregistrements non groupés séparément dans les résultats. false : ne pas regrouper les enregistrements non groupés dans les résultats. Les valeurs non groupées (-1) s’affichent avec le reste des résultats. Valeur par défaut : false
config.inputFieldNames	Tableau	Liste des noms des champs d’entrée sous forme de chaînes. Le modèle utilise ces champs utilisés pour effectuer des prédictions.
config.label	Chaîne	Identifie la tâche de prédiction.
config.maxTimeWindowForUpdate	Numéro	Facultatif. Nombre de minutes précédant le point de mise à jour du modèle pour rechercher des enregistrements. Par exemple, si la valeur est 15, le système recherche uniquement les enregistrements créés au cours des 15 minutes précédentes. Par défaut, le système analyse tous les enregistrements.
config.minRecordsPerCluster	Numéro	Facultatif. Nombre minimum d’enregistrements à autoriser dans n’importe quelle grappe. La valeur doit être supérieure ou égale à 2. Valeur par défaut : 2
config.minRowCount	Chaîne	Facultatif. Nombre minimum d’enregistrements requis dans le jeu de données pour la formation. Par défaut : 10 000
config.processingLanguage	Chaîne	Langue de traitement au format de code de langue ISO 639-1 à deux lettres.
config.mots vides	Tableau	Facultatif. Liste prédéfinie de chaînes que le système génère automatiquement en fonction du language paramètre de propriété. Pour plus d’informations, consultez Créer une liste de mots vides personnalisés. Valeur par défaut : mots vides en anglais
config.trainingFrequency	Chaîne	Fréquence de reformation du modèle. Valeurs possibles : every_30_days every_60_days every_90_days every_120_days every_180_days run_once Valeur par défaut : run_once
config.updateFrequency		Fréquence à laquelle le modèle de la définition de solution doit être reconstruit. Valeurs possibles : do_not_update every_1_day every_1_hour every_6_hours every_12_hours every_1_minute every_15_minutes every_30_minutes Valeur par défaut : do_not_update

L’exemple suivant montre comment créer un objet et l’ajouter à la propriété Magasin ClusteringSolution. L’exemple montre également comment soumettre l’objet pour la formation.

try{
    var myData = new sn_ml.DatasetDefinition({
        'tableName' : 'incident',
        'fieldNames' : ['category', 'short_description', 'state', 'description'],
        'encodedQuery' : 'activeANYTHING'
    });

    // get a trained encoder from the store
    var myEncoder = sn_ml.EncoderStore.get('<encoder_name >');
        
    var mySolution = new sn_ml.ClusteringSolution({
        'label': "clustering solution",
        'dataset' : myData,
        'encoder' : myEncoder,
        'inputFieldNames':['short_description'],                
        'groupByFieldName' : 'category',        
        'algorithmConfig' : {
            'algorithm' : 'kmeans',
            'targetCoverage' : '90'
        }
    });
    
    // add solution
    var solutionName = sn_ml.ClusteringSolutionStore.add(mySolution);
    var solutionVersion = mySolution.submitTrainingJob();    
    var trainingStatus = solutionVersion.getStatus();
    gs.print(JSON.stringify(JSON.parse(trainingStatus), null, 2));

} catch(ex){
    gs.print('Exception caught: '+ ex.getMessage());
}

Sortie :

{
  "state": "waiting_for_training",
  "percentComplete": "0",
  "hasJobEnded": "false"
}

L’exemple suivant montre comment inclure le champ « description » en tant que champ de concept de grappe.

var myIncidentData = new sn_ml.DatasetDefinition({
    'tableName' : 'incident',
    'fieldNames' : ['category', 'short_description', 'description'],
});

var encodersolutionName = sn_ml.EncoderStore.get('<encoder_name >');

var mySolution = new sn_ml.ClusteringSolution({
	'label': 'clustering_test',
	'dataset': myIncidentData,
	'inputFieldNames': ['short_description'],
	'encoder': encodersolutionName,
	'clusterConceptFieldNames': ['description']
});

var solutionNameFromStore = sn_ml.ClusteringSolutionStore.add(mySolution);
var myClassifier = mySolution.submitTrainingJob();

ClusteringSolution : cancelTrainingJob()

Annule une tâche pour un objet de solution qui a été soumis pour une formation.

Tableau 2. Paramètres
Nom	Type	Description
Aucun

Tableau 3. Renvoie
Type	Description
Néant

L’exemple suivant montre comment annuler une tâche de formation existante.

var mySolution = sn_ml.ClusteringSolutionStore.get('ml_sn_global_global_clustering');

mySolution.cancelTrainingJob();

ClusteringSolution : getActiveVersion()

Obtient l’élément actif Objet ClusteringSolutionVersion.

Tableau 4. Paramètres
Nom	Type	Description
Aucun

Tableau 5. Renvoie
Type	Description
Objet	Objet ClusteringSolutionVersion actif.

L’exemple suivant montre comment obtenir une version active Solution de mise en grappe à partir du Store et renvoyer son état de formation.

var mlSolution = sn_ml.ClusteringSolutionStore.get('ml_x_snc_global_global_clustering');

gs.print(JSON.stringify(JSON.parse(mlSolution.getActiveVersion().getStatus()), null, 2));

Sortie :

{
  "state": "solution_complete",
  "percentComplete": "100",
  "hasJobEnded": "true"
}

ClusteringSolution : getAllVersions()

Obtient toutes les versions de une solution de mise en grappe.

Tableau 6. Paramètres
Nom	Type	Description
Aucun

Tableau 7. Renvoie
Type	Description
Tableau	Versions existantes d’un objet de solution. Voir aussi Version de la solution de mise en grappe API.

L’exemple suivant montre comment obtenir tous les objets de version de ClusteringSolution et y appeler les méthodes de version de solution getVersionNumber() et getStatus().

var mlSolution = sn_ml.ClusteringSolutionStore.get('ml_x_snc_global_global_clustering');

var mlSolutionVersions = mlSolution.getAllVersions();

for (i = 0; i < mlSolutionVersions.length; i++) {
gs.print("Version " + mlSolutionVersions[i].getVersionNumber() + " Status: " + mlSolutionVersions[i].getStatus() +"\n");
};

Sortie :

Version 3 Status: {"state":"solution_complete","percentComplete":"100","hasJobEnded":"true"}

Version 2 Status: {"state":"solution_complete","percentComplete":"100","hasJobEnded":"true"}

Version 1 Status: {"state":"solution_cancelled","percentComplete":"0","hasJobEnded":"true"}

ClusteringSolution : getLatestVersion()

Obtient la dernière version de une solution.

Tableau 8. Paramètres
Nom	Type	Description
Aucun

Tableau 9. Renvoie
Type	Description
Objet	ClusteringSolutionVersion Objet correspondant à la dernière version de a ClusteringSolution().

L’exemple suivant montre comment obtenir la dernière version d’une solution et renvoyer son état de formation.

var mlSolution = sn_ml.ClusteringSolutionStore.get('ml_x_snc_global_global_clustering');

gs.print(JSON.stringify(JSON.parse(mlSolution.getLatestVersion().getStatus()), null, 2));

Sortie :

{
  "state": "solution_complete",
  "percentComplete": "100",
  "hasJobEnded": "true"
}

ClusteringSolution : getName()

Obtient le nom de l’objet à utiliser pour interagir avec le magasin.

Tableau 10. Paramètres
Nom	Type	Description
Aucun

Tableau 11. Renvoie
Type	Description
Chaîne	Nom de l’objet de solution.

L’exemple suivant montre comment mettre à jour Solution de mise en grappe les informations d’un jeu de données et imprimer le nom de l’objet.

// Update solution
var myIncidentData = new sn_ml.DatasetDefinition({
   'tableName' : 'incident',
   'fieldNames' : ['category', 'short_description', 'priority'],
   'encodedQuery' : 'activeANYTHING'
});

var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('clustering'));

var myCluster = new sn_ml.ClusteringSolution({
   'label': "my clustering solution",
   'dataset' : myIncidentData,
   'inputFieldNames': eligibleFields['eligibleInputFieldNames'],
   'predictedFieldName': 'category'
});

// update solution
sn_ml.ClusteringSolutionStore.update('ml_x_snc_global_global_clustering_solution', myCluster);

// print solution name
gs.print('Solution Name: '+myCluster.getName());

Sortie :

Solution Name: ml_x_snc_global_global_clustering_solution

ClusteringSolution : getProperties()

Obtient les propriétés de l’objet de solution.

Tableau 12. Paramètres
Nom	Type	Description
Aucun

Tableau 13. Renvoie
Type	Description
Objet	Contenu du jeu de données et détails de l’objet ClusteringSolution() dans le ClusteringSolutionStore. `{ "algorithmConfig": {Object}, "datasetProperties": {Object}, "domainName": "String", "encoder": {Object}, "groupByFieldName": "String", "inputFieldNames": [Array], "label": "String", "minRecordsPerCluster" : Number, "name": "String", "processingLanguage": "String", "scope": "String", "stopwords": [Array], "trainingFrequency": "String", "updateFrequency": "String" }`
<Object>.algorithmConfig	Objet JavaScript contenant les propriétés de configuration de l’algorithme. Les résultats relatifs à la propriété varient selon la valeur définie dans la algorithm propriété. `'algorithmConfig' : { "algorithm": "String", // See algorithmConfig.algorithm setting description for property settings based on algorithm }` Type de données : objet.
<Object>.algorithmConfig.algorithm	Méthode de codage de votre solution. Propriétés pour dbscan: `'algorithmConfig': { "algorithm": "dbscan", "distanceMetric": "String", "epsilon": Number, "minimumNeighbours": Number }` Propriétés pour kmeans: `'algorithmConfig': { "algorithm": "kmeans", "targetCoverage": Number }` Type de données : chaîne.
<Object>.algorithmConfig.distanceMetric	Algorithme DBSCAN uniquement. Mesure de distance à analyser pour rechercher des objets de données similaires. Type de données : chaîne.
<Object>.algorithmConfig.epsilon	Algorithme DBSCAN uniquement. Valeur décimale comprise entre 0 et 1 représentant la taille du rayon de recherche du quartier. Type de données : nombre.
<Object>.algorithmConfig.minimumNeighbours	Algorithme DBSCAN uniquement. Nombre minimum de voisins requis dans un point pour faire partie d’une grappe. En effet levenshteinDistance , la valeur doit être 1 afin qu’aucun point ne soit exclu du jeu de données. Type de données : nombre.
<Object>.algorithmConfig.targetCoverage	K-signifie uniquement l’algorithme. Champ de centile pour filtrer les enregistrements qui sont moins similaires les uns aux autres. Type de données : nombre.
<Object>.datasetProperties	Répertorie les propriétés de l’objet DatasetDefinition() associé à la solution. `{ "encodedQuery": "String", "fieldDetails": [Array], "fieldNames": [Array], "tableName": "String" }` Type de données : objet.
<Object>.datasetProperties.tableName	Nom de la table pour le jeu de données. Par exemple, `« tableName » : « Incident »`. Type de données : chaîne.
<Object>.datasetProperties.fieldNames	Liste de noms de champs de la table spécifiée en tant que chaînes. Par exemple, `« fieldNames » : ["short_description », « priority"]`. Type de données : tableau.
<Object>.datasetProperties.fieldNames.fieldDetails	Liste des objets JavaScript qui spécifient les propriétés des champs. `[ { "name": "String", "type": "String" } ]` Type de données : tableau.
<Object>.datasetProperties.fieldNames.fieldDetails.<object>. Nom	Nom du champ définissant le type d’informations auquel restreindre cet ensemble de données. Type de données : chaîne.
<Object>.datasetProperties.fieldDetails.<object>. Type	Type de champ d’apprentissage machine. Type de données : chaîne.
<Object>.datasetProperties.fieldDetails.encodedQuery	Chaîne de requête codée au format Glide standard. Reportez-vous à la section Chaînes de requêtes codées. Type de données : chaîne.
<Object>.Domainname	Nom de domaine associé à cet ensemble de données. Reportez-vous aux sections Domain separation et Intelligence prédictive. Type de données : chaîne.
<Object>.encoderProperties	Objet codeur affecté à cette solution. Reportez-vous à Encodeur - Encodeur (configuration d’objet). Type de données : objet.
<Object>.groupByFieldName	Nom de champ par lequel le système regroupe les enregistrements en une ou plusieurs grappes. Type de données : chaîne
<Object>.inputFieldNames	Liste des noms des champs d’entrée sous forme de chaînes. Le modèle utilise ces champs utilisés pour effectuer des prédictions. Type de données : chaîne.
<Object>.Étiquette	Identifie la tâche de prédiction. `{ "label": "my first prediction" }` Type de données : chaîne.
<Object>.minRecordsPerCluster	Nombre minimum d’enregistrements à autoriser dans n’importe quelle grappe. Type de données : nombre.
<Object>.Nom	Nom affecté par le système. Type de données : chaîne.
<Object>.predictedFieldName	Identifie un champ à former pour la prévisibilité. Type de données : chaîne.
<Object>.processingLanguage	Langue de traitement au format de code de langue ISO 639-1 à deux lettres. Type de données : chaîne.
<Object>.Portée	Périmètre de l’objet. Actuellement, la seule valeur valide est `globale`. Type de données : chaîne
<Object>.mots vides	Facultatif. Liste prédéfinie de chaînes que le système génère automatiquement en fonction du language paramètre de propriété. Pour plus d’informations, consultez Créer une liste de mots vides personnalisés. Type de données : tableau.
<Object>.trainingFrequency	Fréquence de reformation du modèle. Valeurs possibles : every_30_days every_60_days every_90_days every_120_days every_180_days run_once Valeur par défaut : run_once Type de données : chaîne.
<Object>.updateFrequency (en anglais seulement)	Fréquence à laquelle le modèle de la définition de solution doit être reconstruit. Valeurs possibles : do_not_update every_1_day every_1_hour every_6_hours every_12_hours every_1_minute every_15_minutes every_30_minutes Valeur par défaut : do_not_update Type de données : chaîne

L’exemple suivant obtient les propriétés d’un objet solutiondans le magasin.

var myCluster = new sn_ml.ClusteringSolutionStore.get("ml_x_snc_global_global_clustering_solution");

gs.print(JSON.stringify(JSON.parse(myCluster.getProperties()), null, 2));

Sortie :

*** Script: {
  "algorithmConfig": {
    "algorithm": "kmeans",
    "targetCoverage": "90"
  },
  "datasetProperties": {
    "tableName": "incident",
    "fieldNames": [
      "category",
      "short_description",
      "state",
      "description"
    ],
    "encodedQuery": "activeANYTHING"
  },
  "domainName": "global",
  "encoderProperties": {
    "datasetsProperties": [
      {
        "tableName": "incident",
        "fieldNames": [
          "assignment_group",
          "short_description",
          "description"
        ],
        "encodedQuery": "activeANYTHING"
      }
    ],
    "domainName": "global",
    "label": "my encoder definition",
    "name": "ml_x_snc_global_global_my_encoder_definition",
    "processingLanguage": "en",
    "scope": "global",
    "stopwords": [
      "Default English Stopwords"
    ],
    "trainingFrequency": "run_once"
  },
  "groupByFieldName": "category",
  "inputFieldNames": [
    "short_description"
  ],
  "label": "clustering solution",
  "minRecordsPerCluster": 2,
  "name": "ml_x_snc_global_global_clustering_solution",
  "processingLanguage": "en",
  "scope": "global",
  "stopwords": [
    "Default English Stopwords"
  ],
  "trainingFrequency": "run_once",
  "updateFrequency": "do_not_update"
}}

ClusteringSolution : getVersion(version de chaîne)

Obtient une solution par le numéro de version fourni.

Tableau 14. Paramètres
Nom	Type	Description
version	Chaîne	Numéro de version existant d’une solution.

Tableau 15. Renvoie
Type	Description
Objet	Version spécifiée de l’objet ClusteringSolution() sur lequel vous pouvez appeler les méthodes d’API ClusteringSolutionVersion .

L’exemple suivant montre comment obtenir l’état de formation d’une solution par numéro de version.

var mlSolution = sn_ml.ClusteringSolutionStore.get('ml_x_snc_global_global_clustering');

gs.print(JSON.stringify(JSON.parse(mlSolution.getVersion('1').getStatus()), null, 2));

Sortie :

{
  "state": "solution_complete",
  "percentComplete": "100",
  "hasJobEnded": "true"
}

ClusteringSolution : setActiveVersion (version de chaîne)

Active une version spécifiée d’une solution dans le magasin.

Tableau 16. Paramètres
Nom	Type	Description
version	Chaîne	Nom de la version de l’objet ClusteringSolution() à activer. L’activation de cette version désactive toute autre version.

Tableau 17. Renvoie
Type	Description
Néant

L’exemple suivant montre comment activer une version de solution dans le magasin.

sn_ml.ClusteringSolution.setActiveVersion("ml_incident_categorization");

ClusteringSolution : submitTrainingJob()

Soumet une tâche de formation.

Remarque :

Avant d’exécuter cette méthode, vous devez d’abord ajouter une solution au magasin à l’aide de la méthode ClusteringSolutionStore - add( ).

Tableau 18. Paramètres
Nom	Type	Description
Aucun

Tableau 19. Renvoie
Type	Description
Objet	ClusteringSolutionVersion Objet correspondant à l’objet ClusteringSolution de formation.

L’exemple suivant montre comment créer un jeu de données, l’appliquer à une solution, ajouter la solution à un magasin et soumettre la tâche de formation.

// Create a dataset 
var myData = new sn_ml.DatasetDefinition({

  'tableName' : 'incident',
  'fieldNames' : ['assignment_group', 'short_description', 'description'],
  'encodedQuery' : 'activeANYTHING'

});

// get a trained encoder from the store
var myEncoder = sn_ml.EncoderStore.get('ml_x_snc_global_global_encoder');

// Create a solution 
var mySolution = new sn_ml.ClusteringSolution({

  'label': "my solution definition",
  'dataset' : myData,
  'encoder' : myEncoder,
  'predictedFieldName' : 'assignment_group',
  'inputFieldNames':['short_description']

});

// Add the solution to the store to later be able to retrieve it.
var my_unique_name = sn_ml.ClusteringSolutionStore.add(mySolution);

// Train the solution - this is a long running job 
var myClusterVersion = mySolution.submitTrainingJob();