DatasetDefinition - グローバル

  • リリースバージョン: Zurich
  • 更新日 2025年07月31日
  • 所要時間:7分
  • DatasetDefinition API には、以下を識別するためのメソッドが用意されています。ML トレーニングアルゴリズムの入力として使用する、テーブル名、列、および行の選択基準を含むレコードのセット。データセットには実際のデータは含まれません。

    この API には 予測インテリジェンス プラグイン (com.glide.platform_ml) が必要です。この API は sn_ml 名前空間内で提供されます。 詳細については、「 予測インテリジェンス」を参照してください。

    データセットを使用して、相互情報の PredictabilityEstimate を見積もるか、Encoder で指定されたデータをトレーニングします。また、データセットを使用して、次のいずれかのソリューションタイプで指定されたデータをトレーニングすることもできます。

    使用上のガイドラインについては、「 ML API の使用」を参照してください。

    DatasetDefinition - DatasetDefinition(オブジェクト)

    DatasetDefinition クラスのインスタンスを作成し、テーブル名、フィールド、およびクエリーでデータセットを定義できるようにします。

    テーブルとフィールドのリストを渡してデータセット定義を作成します。クエリーを渡して、特定の特性を持つ行を含めるようにデータセットを制限することもできます。

    一度作成された DatasetDefinition オブジェクトは変更できません。

    表 : 1. パラメーター
    名前 タイプ 説明
    config オブジェクト データセット定義プロパティを含む JavaScript オブジェクトです。
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    config.tableName 文字列 データセットのテーブルの名前。例:"tableName" : "Incident"
    config.fieldNames アレイ オプション。 指定されたテーブルからの文字列としてのフィールド名のリスト。例:"fieldNames" : ["short_description", "priority"]

    デフォルト:すべてのフィールド

    config.fieldDetails アレイ オプション。 フィールドプロパティを指定する JavaScript オブジェクトのリスト。

    このプロパティを使用して、機械学習アルゴリズムに、フィールドを特定のタイプとして解釈させます。fieldNames プロパティにリストされるすべてのフィールドの詳細を取得する必要はありません。すべての詳細は、fieldNames アレイにリストされるフィールドに対応している必要があります。

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name 文字列 このデータセットを制限する情報のタイプを定義するフィールドの名前。 使用する場合、このフィールド名は fieldNames プロパティにリストされる、対応する名前と一致する必要があります。
    config.fieldDetails.type 文字列 機械学習フィールドタイプ。 データタイプを指定すると、ML トレーナーはそのタイプのフィールドを強制的に解釈します。データタイプを指定しない場合は、システムによってタイプが決定されます。
    サポートされるタイプ:
    • nominal:ML は、このフィールドをクラスまたはカテゴリを含むものとして解釈します。
    • numeric:ML は、このフィールドを数値を含むものとして解釈します。
    • text:ML は、このフィールドをテキストを含むものとして解釈します。

    これらのタイプは、機械学習の観点からデータタイプを識別します。ML のタイプは、ソーステーブルにリストされるタイプとは異なる場合があります。フィールドは文字列タイプにすることができますが、その目的は名目上の値をエンコードすることです。たとえば、"XL"、"L"、"M" などの T シャツのサイズは、テーブルでは文字列型ですが、各値は ML の観点から見た名目属性のカテゴリを表します。

    config.encodedQuery 文字列 オプション。 標準の Glide 形式のエンコードされたクエリ文字列。「エンコードされたクエリ文字列」を参照してください。

    クエリーは、絶対的または相対的なクエリーとして構成できます。例えば、クエリーにより、過去 3 か月間 (相対的)、または 5 月から 7 月までの期間 (絶対的) の行を返すことができます。絶対パターンを使用するか相対パターンを使用するかにかかわらず、基になるテーブルの行が変更されると、定義で識別されるデータが変化する可能性があります。

    次の例は、データセット定義を作成する方法を示しています 。

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition - getEligibleFields(文字列 capability)

    指定された機能のソリューション (分類ソリューションなど) に関して、入力フィールド (機能) または予測フィールドのいずれかとして適格なフィールドのリストを返します。適格性は、適切な Glide データタイプのフィールドに基づいて判断されます。

    表 : 2. パラメーター
    名前 タイプ 説明
    機能 文字列 トレーニングに対して適格なフィールドを取得する機能です。このメソッドは現在、分類ソリューションのみをサポートしています。機能に他の値を指定すると、「サポートされていない機能」という例外がスローされます。

    有効な値:"classification"

    表 : 3. 返される内容
    タイプ 説明
    オブジェクト 適格な入力フィールド名と適格な出力フィールド名を含むオブジェクトです。
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.eligibleInputFieldNames トレーニングに対して適格な入力フィールドを示す文字列のリストです。

    データタイプ:アレイ

    <Object>.eligibleOutputFieldNames トレーニングに対して適格な出力フィールドを示す文字列のリストです。

    データタイプ:アレイ

    次の例は、分類ソリューションに対して適格なフィールドを表示する方法を示しています。

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    出力:

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }