DatasetDefinition - 전역

Yokohama API 참조

Release

yokohama

ft:locale

ko-KR

ft:publication_title

Yokohama API 참조

ft:clusterId

crapiref

bundleId

crapiref

workflow

Creator

DatasetDefinition - 전역

릴리스 버전: Yokohama

업데이트 날짜 2025년 01월 30일

읽기6분

DatasetDefinition API는 다음을 식별하는 메서드를 제공합니다.ML 교육 알고리즘에 대한 입력으로 사용할 테이블 이름, 열 및 행 선택 기준을 포함한 기록 세트입니다. 데이터 세트에는 실제 데이터가 포함되지 않습니다.

이 API에는 플러그인(com.glide.platform_ml)이 예측 인텔리전스 필요하며 sn_ml 네임스페이스 내에서 제공됩니다. 자세한 내용은 예측 인텔리전스를 참조하십시오.

데이터 세트를 사용하여 상호 정보 PredictabilityEstimate 또는 Encoder에서 지정한 훈련 데이터를 추정합니다. 데이터 세트를 사용하여 다음 솔루션 유형 중 하나로 지정된 데이터를 학습시킬 수도 있습니다.

사용 지침은 ML API 사용을 참조하세요.

DatasetDefinition - DatasetDefinition(Object)

테이블 이름, 필드 및 쿼리로 데이터 세트를 정의할 수 있는 DatasetDefinition 클래스의 인스턴스를 만듭니다.

테이블과 필드 목록을 전달하여 데이터 세트 정의를 만듭니다. 특정 특성을 가진 행을 포함하도록 데이터 집합을 제한하는 쿼리를 전달할 수도 있습니다.

만든 후에는 DatasetDefinition 개체를 수정할 수 없습니다.

표 1. 매개변수
이름	유형	설명
구성	객체	데이터 세트 정의 속성을 포함하는 JavaScript 객체입니다. `{ "encodedQuery": "String", "fieldDetails": [Array], "fieldNames": [Array], "tableName": "String" }`
config.tableName	문자열	데이터 세트의 테이블 이름입니다. 예: `"tableName" : "Incident"`.
config.fieldNames	배열	옵션입니다. 문자열로 지정된 테이블의 필드 이름 목록입니다. `예: "fieldNames" : ["short_description", "priority"]`. 기본값: 모든 필드
config.fieldDetails	배열	옵션입니다. 필드 속성을 지정하는 JavaScript 객체의 목록입니다. 이 속성을 사용하여 머신 러닝 알고리즘이 필드를 특정 유형으로 해석하도록 강제합니다. 속성에 나열된 모든 필드에 대한 필드 상세 정보를 가져올 필요는 없습니다 fieldNames . 모든 상세 정보는 배열에 나열된 필드와 일치해야 합니다 fieldNames . `[ { "name": "String", "type": "String" } ]`
config.fieldDetails.name	문자열	이 데이터 세트를 제한할 정보의 유형을 정의하는 필드의 이름입니다. 사용하는 경우 이 필드 이름은 속성에 나열된 fieldNames 해당 이름과 일치해야 합니다.
config.fieldDetails.type	문자열	머신 러닝 필드 유형입니다. 데이터 유형을 지정하면 ML 트레이너가 필드를 해당 유형으로 해석해야 합니다. 데이터 유형을 지정하지 않으면 시스템에서 유형을 결정합니다. 지원되는 유형: nominal: ML은 이 필드를 클래스 또는 범주를 포함하는 것으로 해석합니다. numeric: ML은 이 필드를 숫자를 포함하는 것으로 해석합니다. text: ML은 이 필드를 텍스트를 포함하는 것으로 해석합니다. 이러한 형식은 머신 러닝 관점에서 데이터 형식을 식별합니다. ML 유형은 소스 테이블에 나열된 유형과 다를 수 있습니다. 필드는 문자열 형식일 수 있지만 그 목적은 명목상 값을 인코딩하는 것일 수 있습니다. 예를 들어 "XL", "L" 또는 "M"과 같은 티셔츠 크기는 테이블의 문자열 형식이지만 각 값은 ML 관점에서 명목 속성의 범주를 나타냅니다.
config.encodedQuery	문자열	옵션입니다. 표준 Glide 형식으로 인코딩된 쿼리 문자열입니다. 인코딩된 쿼리 문자열을 참조하세요. 쿼리를 절대 또는 상대로 생성할 수 있습니다. 예를 들어 쿼리는 이전 3개월(상대) 또는 5월부터 7월까지의 기간(절대 기간)에 대한 행을 반환할 수 있습니다. 절대 패턴을 사용하든 상대 패턴을 사용하든 기본 테이블의 행이 변경되면 정의에서 식별하는 데이터가 변경될 수 있습니다.

다음 예제에서는 데이터 집합 정의를 만드는 방법을 보여 줍니다.

var myData = new sn_ml.DatasetDefinition(
  { 
     'tableName' : 'incident', 
     'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
     'fieldDetails' : [
       {
         'name' : 'category',
         'type' : 'nominal'
       },
       {
         'name' : 'short_description',
         'type' : 'text'
       }], 
     'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
  });

DatasetDefinition - getEligibleFields(문자열 역량)

지정된 역량의 솔루션(예: 분류 솔루션)과 관련하여 입력 필드(기능) 또는 예측 필드로 적합한 필드 목록을 반환합니다. 자격은 적절한 Glide 데이터 유형이 있는 필드에 따라 결정됩니다.

표 2. 매개변수
이름	유형	설명
역량	문자열	교육에 적합한 필드를 검색할 역량입니다. 이 메서드는 현재 분류 솔루션만 지원하며, 기능에 대한 다른 값은 "지원되지 않는 기능" 예외를 throw합니다. 유효한 값: `"classification"`

표 3. 반환
유형	설명
객체	적합한 입력 필드 이름과 적합한 출력 필드 이름을 포함하는 객체입니다. `{ "eligibleInputFieldNames" : [Array], "eligibleOutputFieldNames" : [Array] }`
<Object>.eligibleInputFieldNames	교육에 적합한 입력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열
<Object>.eligibleOutputFieldNames	교육에 적합한 출력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열

다음 예는 분류 솔루션에 적합한 필드를 표시하는 방법을 보여줍니다.

var myIncidentData = new sn_ml.DatasetDefinition({
  'tableName' : 'incident',
  'encodedQuery' : 'activeANYTHING'
});

var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));

gs.print(JSON.stringify(eligibleFields, null, 2));

출력:

{
  "eligibleInputFieldNames": [
    "resolved_by",
    "short_description",
    "description",
    "notify"
  ],
  "eligibleOutputFieldNames": [
    "parent",
    "caused_by",
    "location",
    "category"
  ]
}