DatasetDefinition - 전역

워싱턴 DC API 참조

Release

washingtondc

ft:locale

ko-KR

ft:publication_title

워싱턴 DC API 참조

ft:clusterId

crapiref

bundleId

crapiref

workflow

Creator

DatasetDefinition - 전역

릴리스 버전: Washingtondc

업데이트 날짜 2024년 02월 01일

읽기6분

식별 ML 교육 알고리즘에 대한 입력으로 사용할 테이블 이름, 열 및 행 선택 기준을 포함하는 기록 세트입니다. 데이터 세트에는 실제 데이터가 포함되어 있지 않습니다.

DatasetDefinition API에는 예측 인텔리전스 플러그인(com.glide.platform_ml)이 필요하며 sn_ml 네임스페이스 내에서 제공됩니다. 자세한 내용은 Predictive Intelligence를 참조하십시오.

데이터 집합을 사용하여 상호 정보 추정 PredictabilityEncoder에서 지정한 데이터를 추정하거나 학습시킵니다. 데이터 세트를 사용하여 다음 솔루션 유형 중 하나로 지정된 데이터를 학습시킬 수도 있습니다.

사용 지침은 ML API 사용을 참조하세요.

DatasetDefinition - DatasetDefinition(객체)

테이블 이름, 필드 및 쿼리로 데이터 집합을 정의할 수 있도록 하는 DatasetDefinition 클래스의 인스턴스를 만듭니다.

테이블과 필드 목록을 전달하여 데이터 세트 정의를 만듭니다. 쿼리를 전달하여 특정 특성을 가진 행을 포함하도록 데이터 세트를 제한할 수도 있습니다.

DatasetDefinition 개체를 만든 후에는 수정할 수 없습니다.

표 1. 매개변수
이름	유형	설명
구성	객체	데이터 세트 정의 속성을 포함하는 JavaScript 객체입니다. `{ "encodedQuery": "String", "fieldDetails": [Array], "fieldNames": [Array], "tableName": "String" }`
config.tableName	문자열	데이터 세트의 테이블 이름입니다. 예: `"tableName" : "Incident"`.
config.fieldNames	배열	옵션입니다. 지정된 테이블의 필드 이름 목록(문자열)입니다. 예를 들어 `"fieldNames" : ["short_description", "priority"]입니다`. 기본값: 모든 필드
config.fieldDetails	배열	옵션입니다. 필드 속성을 지정하는 JavaScript 객체의 목록입니다. 이 속성을 사용하여 머신 러닝 알고리즘이 필드를 특정 유형으로 해석하도록 강제합니다. 속성에 나열된 fieldNames 모든 필드에 대한 필드 상세 정보를 가져올 필요는 없습니다. 모든 상세 정보는 배열에 fieldNames 나열된 필드와 일치해야 합니다. `[ { "name": "String", "type": "String" } ]`
config.fieldDetails.name	문자열	이 데이터 세트를 제한할 정보 유형을 정의하는 필드의 이름입니다. 사용하는 경우 이 필드 이름은 속성에 나열된 fieldNames 해당 이름과 일치해야 합니다.
config.fieldDetails.type	문자열	머신 러닝 필드 유형입니다. 데이터 유형을 지정하면 ML 트레이너가 필드를 해당 유형을 갖는 것으로 해석합니다. 데이터 유형을 지정하지 않으면 시스템에서 유형을 결정합니다. 지원되는 유형: nominal: ML은 이 필드를 클래스 또는 범주를 포함하는 것으로 해석합니다. numeric: ML은 이 필드를 숫자를 포함하는 것으로 해석합니다. text: ML은 이 필드를 텍스트를 포함하는 것으로 해석합니다. 이러한 형식은 기계 학습 관점에서 데이터 형식을 식별합니다. ML 유형은 소스 테이블에 나열된 유형과 다를 수 있습니다. 필드는 문자열 형식일 수 있지만 그 목적은 명목 값을 인코딩하는 것일 수 있습니다. 예를 들어 "XL", "L" 또는 "M"과 같은 티셔츠 크기는 테이블의 문자열 유형이지만 각 값은 ML 관점에서 명목 속성의 범주를 나타냅니다.
config.encodedQuery	문자열	옵션입니다. 표준 Glide 형식으로 인코딩된 쿼리 문자열입니다. 인코딩된 쿼리 문자열을 참조하세요. 쿼리를 절대 또는 상대로 생성할 수 있습니다. 예를 들어 쿼리는 이전 3개월(상대) 또는 5월부터 7월까지의 기간(절대 기간)에 대한 행을 반환할 수 있습니다. 절대 패턴을 사용하든 상대 패턴을 사용하든, 기본 테이블의 행이 변경되면 정의가 식별하는 데이터가 변경될 수 있습니다.

다음 예제에서는 데이터 집합 정의를 만드는 방법을 보여 줍니다.

var myData = new sn_ml.DatasetDefinition(
  { 
     'tableName' : 'incident', 
     'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
     'fieldDetails' : [
       {
         'name' : 'category',
         'type' : 'nominal'
       },
       {
         'name' : 'short_description',
         'type' : 'text'
       }], 
     'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
  });

DatasetDefinition - getEligibleFields(문자열 기능)

지정된 역량의 솔루션(예: 분류 솔루션)과 관련된 입력 필드(기능) 또는 예측 필드로 적합한 필드 목록을 반환합니다. 적합 여부는 적절한 Glide 데이터 유형이 있는 필드를 기준으로 결정됩니다.

표 2. 매개변수
이름	유형	설명
역량	문자열	교육에 적합한 필드를 검색할 수 있는 역량입니다. 이 메서드는 현재 분류 솔루션만 지원하며, 기능에 대한 다른 값은 "지원되지 않는 기능" 예외를 throw합니다. 유효한 값은 `"classification"입니다`.

표 3. 반환
유형	설명
객체	적격 입력 필드 이름 및 적격 출력 필드 이름을 포함하는 객체입니다. `{ "eligibleInputFieldNames" : [Array], "eligibleOutputFieldNames" : [Array] }`
<Object>.eligibleInputFieldNames	교육에 적합한 입력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열
<Object>.eligibleOutputFieldNames	교육에 적합한 출력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열

다음 예제에서는 분류 솔루션에 적합한 필드를 표시하는 방법을 보여 줍니다.

var myIncidentData = new sn_ml.DatasetDefinition({
  'tableName' : 'incident',
  'encodedQuery' : 'activeANYTHING'
});

var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));

gs.print(JSON.stringify(eligibleFields, null, 2));

출력:

{
  "eligibleInputFieldNames": [
    "resolved_by",
    "short_description",
    "description",
    "notify"
  ],
  "eligibleOutputFieldNames": [
    "parent",
    "caused_by",
    "location",
    "category"
  ]
}