DatasetDefinition - 전역

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 읽기5분
  • DatasetDefinition API는 다음을 식별하는 메서드를 제공합니다.ML 교육 알고리즘에 대한 입력으로 사용할 테이블 이름, 열 및 행 선택 기준을 포함하는 기록 세트입니다. 데이터 세트에는 실제 데이터가 포함되어 있지 않습니다.

    자세한 API에는 예측 인텔리전스 플러그인(com.glide.platform_ml)이 필요하며 sn_ml 네임스페이스 내에서 제공됩니다. 내용은 Predictive Intelligence를 참조하십시오.

    이 데이터셋을 사용하여 상호 정보 PredictabilityEstimate 를 추정하거나 인코더로 지정된 데이터를 훈련시킬 수 있습니다. 데이터 세트를 사용하여 다음 솔루션 유형 중 하나로 지정된 데이터를 학습시킬 수도 있습니다.

    사용 지침은 ML API 사용을 참조하세요.

    DatasetDefinition - DatasetDefinition(객체)

    DatasetDefinition 클래스의 인스턴스를 만들어 테이블 이름, 필드 및 쿼리로 데이터 세트를 정의할 수 있습니다.

    테이블과 필드 목록을 전달하여 데이터 세트 정의를 생성합니다. 쿼리를 전달하여 특정 특성을 가진 행을 포함하도록 데이터 세트를 제한할 수도 있습니다.

    생성된 후에는 DatasetDefinition 개체를 수정할 수 없습니다.

    표 1. 매개변수
    이름 유형 설명
    구성 객체 데이터 세트 정의 속성을 포함하는 JavaScript 객체입니다.
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    config.tableName 문자열 데이터 세트의 테이블 이름입니다. 예를 들어 "tableName" : "Incident"입니다.
    config.fieldNames 배열 옵션입니다. 지정된 테이블의 필드 이름을 문자열로 나열한 목록입니다. 예를 들어 "fieldNames" : ["short_description", "priority"]입니다.

    기본값: 모든 필드

    config.fieldDetails 배열 옵션입니다. 필드 속성을 지정하는 JavaScript 객체의 목록입니다.

    이 속성을 사용하여 머신 러닝 알고리즘이 필드를 특정 유형으로 해석하도록 합니다. 속성에 fieldNames 나열된 모든 필드에 대한 필드 상세 정보를 가져올 필요는 없습니다. 모든 상세 정보는 배열에 fieldNames 나열된 필드와 일치해야 합니다.

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name 문자열 이 데이터 세트를 제한할 정보의 유형을 정의하는 필드의 이름입니다. 사용하는 경우 이 필드 이름은 속성에 fieldNames 나열된 해당 이름과 일치해야 합니다.
    config.fieldDetails.type 문자열 머신 러닝 필드 유형입니다. 데이터 유형을 지정하면 ML 트레이너가 필드를 해당 유형으로 해석합니다. 데이터 유형이 지정되지 않으면 시스템이 유형을 결정합니다.
    지원되는 유형:
    • nominal: ML은 이 필드를 클래스 또는 범주를 포함하는 것으로 해석합니다.
    • numeric: ML은 이 필드를 숫자를 포함하는 것으로 해석합니다.
    • text: ML은 이 필드를 텍스트가 포함된 것으로 해석합니다.

    이러한 형식은 기계 학습 관점에서 데이터 형식을 식별합니다. ML 유형은 소스 테이블에 나열된 유형과 다를 수 있습니다. 필드는 문자열 형식일 수 있지만 그 목적은 명목 값을 인코딩하는 것일 수 있습니다. 예를 들어 "XL", "L" 또는 "M"과 같은 티셔츠 크기는 테이블의 문자열 유형이지만 각 값은 ML 관점에서 명목 속성의 범주를 나타냅니다.

    config.encodedQuery 문자열 옵션입니다. 표준 Glide 형식으로 인코딩된 쿼리 문자열입니다. 인코딩된 쿼리 문자열을 참조하세요.

    쿼리를 절대 또는 상대 쿼리로 생성할 수 있습니다. 예를 들어 쿼리는 이전 3개월(상대) 또는 5월에서 7월까지의 기간(절대)에 대한 행을 반환할 수 있습니다. 절대 패턴을 사용하든 상대 패턴을 사용하든 기본 테이블의 행이 변경되면 정의가 식별하는 데이터가 변경될 수 있습니다.

    다음 예제에서는 데이터 집합 정의를 만드는 방법을 보여 줍니다.

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition - getEligibleFields(문자열 기능)

    지정된 역량의 솔루션(예: 분류 솔루션)과 관련하여 입력 필드(기능) 또는 예측 필드로 적합한 필드 목록을 반환합니다. 자격은 적절한 Glide 데이터 유형이 있는 필드에 따라 결정됩니다.

    표 2. 매개변수
    이름 유형 설명
    역량 문자열 교육에 적합한 필드를 검색할 수 있는 역량입니다. 이 메서드는 현재 분류 솔루션만 지원하며, 기능에 대한 다른 값은 "지원되지 않는 기능" 예외를 throw합니다.

    유효한 값: "classification"

    표 3. 반환
    유형 설명
    객체 적격 입력 필드 이름과 적격 출력 필드 이름을 포함하는 객체입니다.
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.eligible입력 필드 이름 교육에 적합한 입력 필드를 나타내는 문자열 목록입니다.

    데이터 유형: 배열

    <Object>.eligible출력 필드 이름 교육에 적합한 출력 필드를 나타내는 문자열 목록입니다.

    데이터 유형: 배열

    다음 예에서는 분류 솔루션에 적합한 필드를 표시하는 방법을 보여줍니다.

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    출력:

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }