DatasetDefinition - 전역
DatasetDefinition API는 다음을 식별하는 메서드를 제공합니다.ML 교육 알고리즘에 대한 입력으로 사용할 테이블 이름, 열 및 행 선택 기준을 포함한 기록 세트입니다. 데이터 세트에는 실제 데이터가 포함되지 않습니다.
이 API에는 플러그인(com.glide.platform_ml)이 예측 인텔리전스 필요하며 sn_ml 네임스페이스 내에서 제공됩니다. 자세한 내용은 예측 인텔리전스를 참조하십시오.
사용 지침은 ML API 사용을 참조하세요.
DatasetDefinition - DatasetDefinition(Object)
테이블 이름, 필드 및 쿼리로 데이터 세트를 정의할 수 있는 DatasetDefinition 클래스의 인스턴스를 만듭니다.
테이블과 필드 목록을 전달하여 데이터 세트 정의를 만듭니다. 특정 특성을 가진 행을 포함하도록 데이터 집합을 제한하는 쿼리를 전달할 수도 있습니다.
만든 후에는 DatasetDefinition 개체를 수정할 수 없습니다.
| 이름 | 유형 | 설명 |
|---|---|---|
| 구성 | 객체 | 데이터 세트 정의 속성을 포함하는 JavaScript 객체입니다. |
| config.tableName | 문자열 | 데이터 세트의 테이블 이름입니다. 예: "tableName" : "Incident". |
| config.fieldNames | 배열 | 옵션입니다. 문자열로 지정된 테이블의 필드 이름 목록입니다. 예: "fieldNames" : ["short_description", "priority"]. 기본값: 모든 필드 |
| config.fieldDetails | 배열 | 옵션입니다. 필드 속성을 지정하는 JavaScript 객체의 목록입니다. 이 속성을 사용하여 머신 러닝 알고리즘이 필드를 특정 유형으로 해석하도록 강제합니다. 속성에 나열된 모든 필드에 대한 필드 상세 정보를 가져올 필요는 없습니다 fieldNames . 모든 상세 정보는 배열에 나열된 필드와 일치해야 합니다 fieldNames . |
| config.fieldDetails.name | 문자열 | 이 데이터 세트를 제한할 정보의 유형을 정의하는 필드의 이름입니다. 사용하는 경우 이 필드 이름은 속성에 나열된 fieldNames 해당 이름과 일치해야 합니다. |
| config.fieldDetails.type | 문자열 | 머신 러닝 필드 유형입니다. 데이터 유형을 지정하면 ML 트레이너가 필드를 해당 유형으로 해석해야 합니다. 데이터 유형을 지정하지 않으면 시스템에서 유형을 결정합니다. 지원되는 유형:
이러한 형식은 머신 러닝 관점에서 데이터 형식을 식별합니다. ML 유형은 소스 테이블에 나열된 유형과 다를 수 있습니다. 필드는 문자열 형식일 수 있지만 그 목적은 명목상 값을 인코딩하는 것일 수 있습니다. 예를 들어 "XL", "L" 또는 "M"과 같은 티셔츠 크기는 테이블의 문자열 형식이지만 각 값은 ML 관점에서 명목 속성의 범주를 나타냅니다. |
| config.encodedQuery | 문자열 | 옵션입니다. 표준 Glide 형식으로 인코딩된 쿼리 문자열입니다. 인코딩된 쿼리 문자열을 참조하세요. 쿼리를 절대 또는 상대로 생성할 수 있습니다. 예를 들어 쿼리는 이전 3개월(상대) 또는 5월부터 7월까지의 기간(절대 기간)에 대한 행을 반환할 수 있습니다. 절대 패턴을 사용하든 상대 패턴을 사용하든 기본 테이블의 행이 변경되면 정의에서 식별하는 데이터가 변경될 수 있습니다. |
다음 예제에서는 데이터 집합 정의를 만드는 방법을 보여 줍니다.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition - getEligibleFields(문자열 역량)
지정된 역량의 솔루션(예: 분류 솔루션)과 관련하여 입력 필드(기능) 또는 예측 필드로 적합한 필드 목록을 반환합니다. 자격은 적절한 Glide 데이터 유형이 있는 필드에 따라 결정됩니다.
| 이름 | 유형 | 설명 |
|---|---|---|
| 역량 | 문자열 | 교육에 적합한 필드를 검색할 역량입니다. 이 메서드는 현재 분류 솔루션만 지원하며, 기능에 대한 다른 값은 "지원되지 않는 기능" 예외를 throw합니다. 유효한 값: |
| 유형 | 설명 |
|---|---|
| 객체 | 적합한 입력 필드 이름과 적합한 출력 필드 이름을 포함하는 객체입니다. |
| <Object>.eligibleInputFieldNames | 교육에 적합한 입력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열 |
| <Object>.eligibleOutputFieldNames | 교육에 적합한 출력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열 |
다음 예는 분류 솔루션에 적합한 필드를 표시하는 방법을 보여줍니다.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
출력:
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}