DatasetDefinition - グローバル
DatasetDefinition API は、ML トレーニングアルゴリズムの入力として使用する、テーブル名、列、および行の選択基準を含むレコードのセット。データセットには実際のデータは含まれていません。
この API には 予測インテリジェンス プラグイン (com.glide.platform_ml) が必要です。この API は sn_ml 名前空間内で提供されます。 詳細については、「 予測インテリジェンス」を参照してください。
使用上のガイドラインについては、「 ML API の使用」を参照してください。
DatasetDefinition - DatasetDefinition(オブジェクト)
DatasetDefinition クラスのインスタンスを作成し、テーブル名、フィールド、およびクエリーでデータセットを定義できるようにします。
テーブルとフィールドのリストを渡してデータセット定義を作成します。クエリーを渡して、特定の特性を持つ行を含めるようにデータセットを制限することもできます。
一度作成された DatasetDefinition オブジェクトは変更できません。
| 名前 | タイプ | 説明 |
|---|---|---|
| config | オブジェクト | データセット定義プロパティを含む JavaScript オブジェクトです。 |
| config.tableName | 文字列 | データセットのテーブルの名前。例:"tableName" : "Incident" |
| config.fieldNames | アレイ | オプション。 指定されたテーブルからの文字列としてのフィールド名のリスト。例:"fieldNames" : ["short_description", "priority"] デフォルト:すべてのフィールド |
| config.fieldDetails | アレイ | オプション。 フィールドプロパティを指定する JavaScript オブジェクトのリスト。 このプロパティを使用して、機械学習アルゴリズムに、フィールドを特定のタイプとして解釈させます。fieldNames プロパティにリストされるすべてのフィールドの詳細を取得する必要はありません。すべての詳細は、fieldNames アレイにリストされるフィールドに対応している必要があります。 |
| config.fieldDetails.name | 文字列 | このデータセットを制限する情報のタイプを定義するフィールドの名前。 使用する場合、このフィールド名は fieldNames プロパティにリストされる、対応する名前と一致する必要があります。 |
| config.fieldDetails.type | 文字列 | 機械学習フィールドタイプ。 データタイプを指定すると、ML トレーナーはそのタイプのフィールドを強制的に解釈します。データタイプを指定しない場合は、システムによってタイプが決定されます。 サポートされるタイプ:
これらのタイプは、機械学習の観点からデータタイプを識別します。ML のタイプは、ソーステーブルにリストされるタイプとは異なる場合があります。フィールドは文字列タイプにすることができますが、その目的は名目上の値をエンコードすることです。たとえば、「XL」、「L」、「M」などの T シャツ サイズはテーブル内の文字列型ですが、各値は ML の観点から見た名義型属性のカテゴリを表します。 |
| config.encodedQuery | 文字列 | オプション。 標準の Glide 形式のエンコードされたクエリ文字列。「 エンコードされたクエリ文字列」を参照してください。 クエリーは、絶対的または相対的なクエリーとして構成できます。例えば、クエリーにより、過去 3 か月間 (相対的)、または 5 月から 7 月までの期間 (絶対的) の行を返すことができます。絶対パターンを使用するか相対パターンを使用するかにかかわらず、基になるテーブルの行が変更されると、定義で識別されるデータが変化する可能性があります。 |
次の例は、データセット定義を作成する方法を示しています 。
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition - getEligibleFields(文字列 capability)
指定された機能のソリューション (分類ソリューションなど) に関して、入力フィールド (機能) または予測フィールドのいずれかとして適格なフィールドのリストを返します。適格性は、適切な Glide データタイプのフィールドに基づいて判断されます。
| 名前 | タイプ | 説明 |
|---|---|---|
| 機能 | 文字列 | トレーニングに対して適格なフィールドを取得する機能です。このメソッドは現在、分類ソリューションのみをサポートしています。機能に他の値を指定すると、「サポートされていない機能」という例外がスローされます。 有効な値: |
| タイプ | 説明 |
|---|---|
| オブジェクト | 適格な入力フィールド名と適格な出力フィールド名を含むオブジェクトです。 |
| <Object>.eligibleInputFieldNames | トレーニングに対して適格な入力フィールドを示す文字列のリストです。 データタイプ:アレイ |
| <Object>.eligibleOutputFieldNames | トレーニングに対して適格な出力フィールドを示す文字列のリストです。 データタイプ:アレイ |
次の例は、分類ソリューションに対して適格なフィールドを表示する方法を示しています。
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
出力:
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}