DatasetDefinition - Global

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 4 min. de leitura
  • . DatasetDefinition A API fornece métodos para identificar Um conjunto de registros, incluindo um nome de tabela, colunas e critérios de seleção de linha a serem usados como entrada para algoritmos de treinamento DE ML. Os conjuntos de dados não contêm os dados reais.

    Isso A API requer Inteligência preditiva plug-in (com.glide.platform_ml) e é fornecido em sn_ml namespace. Para obter informações, consulte Inteligência preditiva .

    Use o conjunto de dados para estimar informações mútuas PredicabilityEstimate ou treinar dados especificados por um Codificador . Você também pode usar o conjunto de dados para treinar dados especificados por um dos seguintes tipos de solução:

    Para obter diretrizes de uso, consulte Usando APIs DE ML .

    DatasetDefinition - DatasetDefinition (objeto)

    Cria uma instância do DatasetDefinition , permitindo que você defina um conjunto de dados por nome de tabela, campos e consulta.

    Passe uma tabela e uma lista de campos para criar sua definição de conjunto de dados. Você também pode passar uma consulta para restringir os conjuntos de dados para incluir linhas com características específicas.

    Uma vez criado, um objeto DatasetDefinition não pode ser modificado.

    Tabela 1. Parâmetros
    Nome Tipo Descrição
    config Objeto Objeto JavaScript que contém as propriedades de definição do conjunto de dados.
    {
      "encodedQuery": "String",
      "fieldDetails": [Array],
      "fieldNames": [Array],
      "tableName": "String"
    }
    Config.tablename Cadeia de caracteres Nome da tabela do conjunto de dados. Por exemplo, "Tablename" : "Incidente" .
    Config.fieldnames Matriz Opcional. Lista de nomes de campos da tabela especificada como cadeias de caracteres. Por exemplo, "Fieldnames" : ["short_description", "prioridade"] .

    Padrão: Todos os campos

    Config.fieldDetails Matriz Opcional. Lista de objetos JavaScript que especificam propriedades de campo.

    Use esta propriedade para forçar os algoritmos de aprendizado de máquina a interpretar campos como sendo um tipo específico. Você não precisa obter detalhes do campo para cada campo listado em fieldNamespropriedade. Todos os detalhes devem corresponder a um campo listado em fieldNamesmatriz.

    [
      {
        "name": "String",
        "type": "String"
      }
    ]
    config.fieldDetails.name Cadeia de caracteres Nome do campo que define o tipo de informação ao qual restringir este conjunto de dados.Se usado, este nome de campo deve corresponder ao nome correspondente listado em fieldNamespropriedade.
    Config.fieldDetails.type Cadeia de caracteres Tipo de campo de aprendizado de máquina. Especificar o tipo de dados força o instrutor DE ML a interpretar um campo como tendo esse tipo. Se nenhum tipo de dados for especificado, o sistema determinará o tipo.
    Tipos compatíveis:
    • nominal: ML interpreta este campo como contendo classes ou categorias.
    • numeric: ML interpreta este campo como contendo números.
    • text: ML interpreta este campo como contendo texto.

    Esses tipos identificam tipos de dados de uma perspectiva de aprendizado de máquina. O tipo DE ML pode ser diferente do tipo listado na tabela de origem. Um campo pode ser um tipo de cadeia de caracteres, mas sua finalidade pode ser codificar um valor nominal. Por exemplo, tamanhos de camiseta como "XL", "L" ou "M" são tipos de cadeia de caracteres na tabela, mas cada valor representa uma categorização de um atributo nominal de uma perspectiva de ML.

    Config.encodedQuery Cadeia de caracteres Opcional. Cadeia de caracteres de consulta codificada no formato Glide padrão. Consulte Cadeias de caracteres de consulta codificadas .

    Você pode construir a consulta para ser absoluta ou relativa. Por exemplo, sua consulta pode retornar linhas dos 3 meses anteriores (relativo) ou para o período de maio a julho (absoluto). Usando um padrão absoluto ou relativo, os dados que uma definição identifica podem mudar se as linhas na tabela subjacente mudarem.

    O exemplo a seguir mostra como criar uma definição de conjunto de dados.

    var myData = new sn_ml.DatasetDefinition(
      { 
         'tableName' : 'incident', 
         'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
         'fieldDetails' : [
           {
             'name' : 'category',
             'type' : 'nominal'
           },
           {
             'name' : 'short_description',
             'type' : 'text'
           }], 
         'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
      });

    DatasetDefinition - getEligibleFields (capacidade de cadeia de caracteres)

    Retorna uma lista de campos qualificados como campos de entrada (recursos) ou campos previstos em relação a uma solução de uma determinada capacidade, por exemplo, uma solução de classificação. A qualificação é determinada com base nos campos que têm os tipos de dados Glide apropriados.

    Tabela 2. Parâmetros
    Nome Tipo Descrição
    capacidade Cadeia de caracteres Capacidade para a qual recuperar campos qualificados para treinamento. Atualmente, este método oferece suporte somente a soluções de classificação, qualquer outro valor para a capacidade gera uma exceção "capacidade não compatível".

    Valores válidos: "classificação"

    Tabela 3. Retornos
    Tipo Descrição
    Objeto Objeto que contém nomes de campos de entrada qualificados e nomes de campos de saída qualificados.
    {	 
      "eligibleInputFieldNames" : [Array],
      "eligibleOutputFieldNames" : [Array] 
    }
    <Object>.EligibleInputFieldNames Lista de cadeias de caracteres que indicam campos de entrada qualificados para treinamento.

    Tipo de dados: Matriz

    <Object>.EligibleOutputFieldNames Lista de cadeias de caracteres que indicam campos de saída qualificados para treinamento.

    Tipo de dados: Matriz

    O exemplo a seguir mostra como exibir campos qualificados para uma solução de classificação.

    var myIncidentData = new sn_ml.DatasetDefinition({
      'tableName' : 'incident',
      'encodedQuery' : 'activeANYTHING'
    });
    
    var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
    
    gs.print(JSON.stringify(eligibleFields, null, 2));

    Saída:

    {
      "eligibleInputFieldNames": [
        "resolved_by",
        "short_description",
        "description",
        "notify"
      ],
      "eligibleOutputFieldNames": [
        "parent",
        "caused_by",
        "location",
        "category"
      ]
    }