Criar e treinar uma solução de regressão

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 7 min. de leitura
  • Treine sua solução usando dados históricos para prever saídas numéricas, como uma temperatura ou um preço de ação. Por exemplo, você pode usar a regressão para estimar o tempo necessário para resolver um incidente ou um caso.

    Antes de Iniciar

    Importante:
    O suporte para novas soluções de regressão está obsoleto na versão Washington DC. Você ainda poderá editar e treinar as soluções existentes, mas não poderá criar novas.

    Função necessária: ml_admin ou admin

    Por Que e Quando Desempenhar Esta Tarefa

    As soluções de regressão permitem prever uma estimativa de ponto e um intervalo de previsão. O modelo resultante fornece as seguintes estatísticas:
    • Erro absoluto médio (MAE), que mede o desvio médio de um valor previsto do valor real. Essa métrica é útil e fácil de entender, já que sua escala é igual à da meta. No entanto, o MAE é ilimitado, dificultando a comparação entre os modelos.
    • O erro percentual médio simétrico (SMAPE) é um valor percentual do desvio do previsto para o real. O SMAPE é uma versão vinculada do MAE, exceto por ter um intervalo de valores entre 0 e 100. Quanto menor o valor de SMAPE, melhor a precisão do modelo.
    • A precisão do intervalo é a porcentagem dos valores reais entre um intervalo previsto. Em outras palavras, é o intervalo entre os limites superior e inferior da previsão. Por exemplo, se quatro dos cinco valores reais estiverem dentro do intervalo previsto, a precisão do intervalo será de 80%.
    • A largura média do intervalo é a diferença entre os limites superior e inferior da previsão. Esta métrica explica o quão informativo é o intervalo. Quanto menor a largura média, melhor o modelo

    Ao fazer previsões, a regressão também permite que você especifique um nível de confiança para o intervalo de previsão (intervalo).

    Neste procedimento de exemplo, você cria e treina uma definição de solução de regressão para prever a quantidade de tempo necessária para restaurar um banco de dados em nuvem.

    Procedimento

    1. Navegar até Todos > Predictive Intelligence > Regressão > Definições de solução.
    2. Na lista Definições de regressão, clique em Novo.
    3. No formulário Definição de regressão, configure esses campos de acordo com a orientação a seguir.
      Campo valor
      Rótulo Insira um nome exclusivo para sua solução de regressão. Por exemplo, neste caso de uso, você pode inserir Teste de regressão para Restauração de banco de dados.
      Nome Conforme você insere o valor do rótulo da solução, este campo é preenchido automaticamente com um nome atribuído pelo sistema que é semelhante ao valor do rótulo.
      Corpus de palavras

      Selecione um corpus de palavras existente que seja relevante para sua solução. Por exemplo, neste caso de uso, você seleciona um corpus de palavras que tem um título como Incidentes nos últimos 3 meses.

      Se você não tiver um corpus de palavras relevante, siga as etapas para criar um corpus de palavras primeiro. Quando o corpus de palavras estiver completo, você poderá selecioná-lo no campo Corpus de palavras no formulário de definição de regressão.

      No entanto, a seleção do corpus de palavras é opcional. Se os dados de entrada tiverem colunas de texto e você não escolher um corpus de palavras, sua solução de regressão treinará um novo modelo de corpus de palavras usando as colunas de texto nos dados de entrada. O corpus de palavras resultante pode ser reutilizado em qualquer outra solução de regressão ou outro tipo de solução de ML.

      Nota:
      Um modelo pré-treinado é usado em vez do Word Corpus para usuários que ativaram Inteligência preditiva começando em Utah.
      Tabela Selecione a tabela de banco de dados na qual você está aplicando a regressão. A tabela deve conter registros históricos que o sistema pode usar para prever o período de tempo para a restauração do banco de dados.
      Campo de Saída

      Selecione o campo cujo valor você deseja que o modelo preditivo defina.

      Em geral, um bom campo de saída é um campo numérico, inteiro ou de ponto flutuante.

      Neste cenário de exemplo, você usa o campo Duração para medir um período de tempo. O campo de saída deve gerar um valor numérico.

      Campos Selecione um ou mais tipos de campo que ajudem o sistema a identificar os registros que você deseja treinar usando a regressão. Neste cenário de exemplo, você usa Descrição resumida, Datacenter de origem , Datacenterde destinoe Tamanho do bancode dados . (short_description, Sourcedc, Targetdc e Dbsize.) Os tipos de campo de entrada podem ser cadeia de caracteres, nominais ou numéricos.
      Filtro (Opcional) Adicione condições de filtro aos registros de campo de saída que você deseja treinar usando regressão.
      Nota:
      • O número mínimo de registros para treinamento de regressão é de 10.000 registros.
      • O número máximo de registros para treinamento de regressão é limitado a 300.000.
      Idioma de processamento Selecione o idioma primário do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha italiano. Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.
      Nota:
      O termo processamento indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Essas etapas incluem tokenização de palavras, remoção de palavras irrelevantes e lematização.
      Palavras irrelevantes Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes que usa o mesmo idioma. Por exemplo, se o idioma de processamento for italiano, a lista Palavras irrelevantes padrão em italiano será exibida. A lista Palavras irrelevantes padrão em inglês também é exibida na sua seleção. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicioná-la à sua solução. Neste cenário, você usa a lista Palavras irrelevantes padrão em inglês.
      Frequência de Treinamento
      Selecione a frequência com que o sistema gera novamente a solução com base nos registros que correspondem ao filtro. Suas opções incluem:
      • Executar uma vez
      • A cada 30 dias
      • A cada 60 dias
      • A cada 90 dias
      • A cada 120 dias
      • A cada 180 dias

      Neste cenário, você seleciona A cada 30 dias

      Por padrão, o sistema executa o treinamento uma vez. Esta prática fornece tempo para revisar e atualizar a definição da solução conforme necessário até que ela forneça valores de cobertura e precisão aceitáveis.

      Nota:
      • O número mínimo de registros necessários para o treinamento da solução de regressão é definido em 10.000.
      • O programador de ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento de ML por instância em uma janela de 24 horas. Este limite exclui solicitações programadas para retreinamento. Além disso, as atualizações de cluster e de semelhança também são excluídas deste limite, mesmo que as novas solicitações de treinamento excedam 50 em uma janela de 24 horas.
    4. Clique na opção de menu de contexto ou no botão apropriado para a definição da sua solução.
      OpçãoDescrição
      Salvar ou Salvar e Treinar Salve seu registro de definição de solução para poder retornar a ele mais tarde ou salve-o e envie-o para treinamento.
      Enviar ou Enviar e Treinar Crie seu registro de definição de solução e envie-o ou envie-o e treine-o.
    5. Se você enviou a solução para treinamento, clique em OK na janela de ativação de treinamento para confirmar.

      O sistema programa a solução para treinamento com o serviço de treinamento mais próximo. O sistema envia uma notificação quando o treinamento é concluído, incluindo todos os erros que podem ter ocorrido no treinamento. Todos os outros usuários podem assinar a categoria Notificações Inteligência preditiva. Quando o treinamento é concluído, o sistema carrega a solução como um registro de anexo.

    O que Fazer Depois

    Neste cenário de exemplo, você criou uma solução de ML a partir da definição da solução. As guias Estatísticas de solução, Solução de teste e Definição de solução aparecem na seção Links relacionados da sua solução de ML.

    Na guia Estatísticas da solução, revise as estatísticas Estimativa de ponto e Intervalo (intervalo de previsão) geradas pela sua solução.

    As estatísticas de previsão da solução que você criou e treinou.

    Na guia Soluções de teste da sua solução, você pode testar a saída da previsão dos registros usados como entrada para a previsão inserindo valores para os campos de entrada, como Datacenter de origem , Datacenterde destinoe Tamanho do bancode dados . Você também pode usar o nível de confiança de previsão padrão de 95ou inserir um nível diferente entre 0 e 100. Usar 95 como o valor significa que o sistema tem 95% de confiança de que a previsão real está dentro do intervalo de previsão. Clique no botão Executar teste para encontrar a saída da previsão.

    Os valores que você precisa inserir para executar um teste de saída de previsão.

    Depois de executar o teste, as estatísticas de saída da previsão são exibidas. A estimativa de ponto na tela é um valor único em um ponto no tempo. Por exemplo, a restauração do banco de dados leva 134,47 segundos para ser concluída. Os limites inferior e superior na tela significam um valor de precisão de intervalo. Por exemplo, a restauração do banco de dados leva de 84,53 a 185,41 segundos para ser concluída.

    Os valores de saída de teste para as previsões de estimativa de ponto e precisão de intervalo.