DatasetDefinition - 전역
식별 ML 교육 알고리즘에 대한 입력으로 사용할 테이블 이름, 열 및 행 선택 기준을 포함하는 기록 세트입니다. 데이터 세트에는 실제 데이터가 포함되어 있지 않습니다.
DatasetDefinition API에는 예측 인텔리전스 플러그인(com.glide.platform_ml)이 필요하며 sn_ml 네임스페이스 내에서 제공됩니다. 자세한 내용은 Predictive Intelligence를 참조하십시오.
사용 지침은 ML API 사용을 참조하세요.
DatasetDefinition - DatasetDefinition(객체)
테이블 이름, 필드 및 쿼리로 데이터 집합을 정의할 수 있도록 하는 DatasetDefinition 클래스의 인스턴스를 만듭니다.
테이블과 필드 목록을 전달하여 데이터 세트 정의를 만듭니다. 쿼리를 전달하여 특정 특성을 가진 행을 포함하도록 데이터 세트를 제한할 수도 있습니다.
DatasetDefinition 개체를 만든 후에는 수정할 수 없습니다.
| 이름 | 유형 | 설명 |
|---|---|---|
| 구성 | 객체 | 데이터 세트 정의 속성을 포함하는 JavaScript 객체입니다. |
| config.tableName | 문자열 | 데이터 세트의 테이블 이름입니다. 예: "tableName" : "Incident". |
| config.fieldNames | 배열 | 옵션입니다. 지정된 테이블의 필드 이름 목록(문자열)입니다. 예를 들어 "fieldNames" : ["short_description", "priority"]입니다. 기본값: 모든 필드 |
| config.fieldDetails | 배열 | 옵션입니다. 필드 속성을 지정하는 JavaScript 객체의 목록입니다. 이 속성을 사용하여 머신 러닝 알고리즘이 필드를 특정 유형으로 해석하도록 강제합니다. 속성에 나열된 fieldNames 모든 필드에 대한 필드 상세 정보를 가져올 필요는 없습니다. 모든 상세 정보는 배열에 fieldNames 나열된 필드와 일치해야 합니다. |
| config.fieldDetails.name | 문자열 | 이 데이터 세트를 제한할 정보 유형을 정의하는 필드의 이름입니다. 사용하는 경우 이 필드 이름은 속성에 나열된 fieldNames 해당 이름과 일치해야 합니다. |
| config.fieldDetails.type | 문자열 | 머신 러닝 필드 유형입니다. 데이터 유형을 지정하면 ML 트레이너가 필드를 해당 유형을 갖는 것으로 해석합니다. 데이터 유형을 지정하지 않으면 시스템에서 유형을 결정합니다. 지원되는 유형:
이러한 형식은 기계 학습 관점에서 데이터 형식을 식별합니다. ML 유형은 소스 테이블에 나열된 유형과 다를 수 있습니다. 필드는 문자열 형식일 수 있지만 그 목적은 명목 값을 인코딩하는 것일 수 있습니다. 예를 들어 "XL", "L" 또는 "M"과 같은 티셔츠 크기는 테이블의 문자열 유형이지만 각 값은 ML 관점에서 명목 속성의 범주를 나타냅니다. |
| config.encodedQuery | 문자열 | 옵션입니다. 표준 Glide 형식으로 인코딩된 쿼리 문자열입니다. 인코딩된 쿼리 문자열을 참조하세요. 쿼리를 절대 또는 상대로 생성할 수 있습니다. 예를 들어 쿼리는 이전 3개월(상대) 또는 5월부터 7월까지의 기간(절대 기간)에 대한 행을 반환할 수 있습니다. 절대 패턴을 사용하든 상대 패턴을 사용하든, 기본 테이블의 행이 변경되면 정의가 식별하는 데이터가 변경될 수 있습니다. |
다음 예제에서는 데이터 집합 정의를 만드는 방법을 보여 줍니다.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
DatasetDefinition - getEligibleFields(문자열 기능)
지정된 역량의 솔루션(예: 분류 솔루션)과 관련된 입력 필드(기능) 또는 예측 필드로 적합한 필드 목록을 반환합니다. 적합 여부는 적절한 Glide 데이터 유형이 있는 필드를 기준으로 결정됩니다.
| 이름 | 유형 | 설명 |
|---|---|---|
| 역량 | 문자열 | 교육에 적합한 필드를 검색할 수 있는 역량입니다. 이 메서드는 현재 분류 솔루션만 지원하며, 기능에 대한 다른 값은 "지원되지 않는 기능" 예외를 throw합니다. 유효한 값은 |
| 유형 | 설명 |
|---|---|
| 객체 | 적격 입력 필드 이름 및 적격 출력 필드 이름을 포함하는 객체입니다. |
| <Object>.eligibleInputFieldNames | 교육에 적합한 입력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열 |
| <Object>.eligibleOutputFieldNames | 교육에 적합한 출력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열 |
다음 예제에서는 분류 솔루션에 적합한 필드를 표시하는 방법을 보여 줍니다.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
출력:
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}