Criar e treinar uma solução de regressão

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 7 min. de leitura
  • Treine sua solução usando dados históricos para prever saídas numéricas, como uma temperatura ou um preço de ação. Por exemplo, você pode usar a regressão para estimar o tempo necessário para resolver um incidente ou um caso.

    Antes de Iniciar

    Importante:
    O suporte para novas soluções de regressão está obsoleto na versão Yokohama. Você ainda poderá editar e treinar as soluções existentes, mas não poderá criar novas.

    Função necessária: ml_admin ou admin

    Por Que e Quando Desempenhar Esta Tarefa

    As soluções de regressão permitem prever uma estimativa de ponto e um intervalo de previsão. O modelo resultante fornece as seguintes estatísticas:
    • Erro absoluto médio (MAE), que mede o desvio médio de um valor previsto do valor real. Essa métrica é útil e fácil de entender, já que sua escala é a mesma que a de seu destino. No entanto, o MAE é ilimitado, dificultando a comparação entre modelos.
    • O erro percentual médio absoluto simétrico (SMAPE) é um valor percentual do desvio do previsto para o real. SMAPE é uma versão limitada do MAE, exceto por ter um intervalo de valores entre 0 e 100. Quanto menor o valor de SMAPE, melhor será a precisão do modelo.
    • Precisão do intervalo é a porcentagem de valores reais entre um intervalo previsto. Em outras palavras, é o intervalo entre os limites superior e inferior da previsão. Por exemplo, se quatro de cinco valores reais estiverem dentro do intervalo previsto, a precisão do intervalo será de 80%.
    • A largura média do intervalo é a diferença entre os limites superior e inferior da previsão. Esta métrica explica o quão informativo é o intervalo. Quanto menor for a largura média, melhor será o modelo

    Ao fazer previsões, a regressão também permite especificar um nível de confiança para o intervalo de previsão (intervalo).

    Neste procedimento de exemplo, você cria e treina uma definição de solução de regressão para prever o tempo necessário para restaurar um banco de dados em nuvem.

    Procedimento

    1. Navegar até Tudo > Inteligência preditiva > Regressão > Definições de solução.
    2. Na lista Definições de regressão, clique em Novo.
    3. No formulário Definição de regressão, configure esses campos de acordo com a orientação a seguir.
      Campo Valor
      Rótulo Insira um nome exclusivo para sua solução de regressão. Por exemplo, neste caso de uso, você pode inserir Teste de regressão para restauração do banco de dados.
      Nome Conforme você insere o valor do rótulo da solução, este campo é preenchido automaticamente com um nome atribuído pelo sistema semelhante ao valor do rótulo.
      Corpus de palavras

      Selecione um corpus de palavras existente que seja relevante para sua solução. Por exemplo, neste caso de uso, você seleciona um corpus de palavras que tem um título como Incidentes nos últimos 3 meses.

      Se você não tiver um corpus de palavras relevante, siga as etapas para criar um corpus de palavras primeiro. Quando o corpus de palavras estiver completo, você poderá selecioná-lo no campo Corpus de palavras no formulário Definição de regressão.

      No entanto, a seleção do corpus de palavras é opcional. Se os dados de entrada tiverem colunas de texto e você não escolher um corpus de palavras, sua solução de regressão treinará um novo modelo de corpus de palavras usando as colunas de texto nos dados de entrada. O corpus de palavras resultante pode ser reutilizado em qualquer outra solução de regressão ou outro tipo de solução de ML.

      Nota:
      Um modelo pré-treinado é usado em vez do Word Corpus para usuários que ativaram Inteligência preditiva a partir de Utah.
      Tabela Selecione a tabela de banco de dados na qual você está aplicando a regressão. A tabela deve conter registros históricos que o sistema pode usar para prever o período de tempo para a restauração do banco de dados.
      Campo de Saída

      Selecione o campo cujo valor você deseja que o modelo preditivo defina.

      Em geral, um bom campo de saída é um campo numérico, inteiro ou de ponto flutuante.

      Neste cenário de exemplo, você usa o campo Duração para medir um período de tempo. O campo de saída deve gerar um valor numérico.

      Campos Selecione um ou mais tipos de campo que ajudam o sistema a identificar os registros que você deseja treinar usando a regressão. Neste cenário de exemplo, você usa Descrição resumida, Datacenter de origem, Datacenter de destinoe Tamanho do banco de dados. (short_description, Sourcedc, Targetdc e Dbsize.) Os tipos de campo de entrada podem ser cadeia de caracteres, nominais ou numéricos.
      Filtro (Opcional) Adicione condições de filtro aos registros de campo de saída que você deseja treinar usando regressão.
      Nota:
      • O número mínimo de registros para treinamento de regressão é de 10.000 registros.
      • O número máximo de registros para treinamento de regressão está limitado a 300.000.
      Idioma de Processamento Selecione o idioma primário do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha italiano. Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.
      Nota:
      O termo processamento indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Essas etapas incluem tokenização de palavras, remoção de palavras irrelevantes e truncamento.
      Palavras irrelevantes Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes que usa o mesmo idioma. Por exemplo, se o seu idioma de processamento for italiano, a lista Palavras irrelevantes padrão em italiano será exibida. A lista Palavras irrelevantes padrão em inglês também é exibida em sua seleção. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicioná-la à sua solução. Neste cenário, você usa a lista Palavras irrelevantes padrão em inglês.
      Frequência de Treinamento
      Selecione a frequência com que o sistema gera novamente a solução com base nos registros correspondentes ao Filtro. Suas opções incluem:
      • Executar uma vez
      • A cada 30 dias
      • A cada 60 dias
      • A cada 90 dias
      • A cada 120 dias
      • A cada 180 dias

      Neste cenário, você seleciona A cada 30 dias

      Por padrão, o sistema executa o treinamento uma vez. Esta prática permite que você revise e atualize a definição da solução conforme necessário até que ela forneça valores aceitáveis de cobertura e precisão.

      Nota:
      • O número mínimo de registros necessários para o treinamento da solução de regressão está definido em 10.000.
      • O programador de ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento de ML por instância em uma janela de 24 horas. Este limite exclui solicitações programadas para retreinamento. Além disso, as atualizações de clustering e semelhança também são excluídas deste limite, mesmo se as novas solicitações de treinamento excederem 50 em uma janela de 24 horas.
    4. Clique na opção ou botão apropriado do menu de contexto para a definição da solução.
      OpçãoDescrição
      Salvar ou Salvar e Treinar Salve seu registro de definição de solução para que você possa retornar mais tarde ou salve-o e envie-o para treinamento.
      Enviar ou Enviar e Treinar Crie seu registro de definição de solução e envie-o ou envie-o e treine-o.
    5. Se você enviou a solução para treinamento, clique em OK na janela Ativação de treinamento para confirmar.

      O sistema programa a solução para treinamento com o serviço de treinamento mais próximo. O sistema envia uma notificação quando o treinamento é concluído, incluindo quaisquer erros que possam ter ocorrido no treinamento. Todos os outros usuários podem assinar a categoria Inteligência preditiva Notificações. Quando o treinamento é concluído, o sistema carrega a solução como um registro de anexo.

    O que Fazer Depois

    Neste cenário de exemplo, você criou uma solução de ML a partir da definição da solução. As guias Estatísticas da solução, Solução de teste e Definição da solução são exibidas na seção Links relacionados da sua solução de ML.

    Na guia Estatísticas da Solução, revise as estatísticas de Estimativa de Ponto e Intervalo (intervalo de previsão) geradas por sua solução.

    As estatísticas de previsão da solução que você criou e treinou.

    Na guia Soluções de teste da sua solução, você pode testar a saída de previsão dos registros usados como entrada para a previsão inserindo valores para os campos de entrada, como Datacenter de origem, Datacenter de destinoe Tamanho do banco de dados. Você também pode usar o nível de confiança de previsão padrão de 95ou inserir um nível diferente entre 0 e 100. Usar 95 como o valor significa que o sistema tem 95% de confiança de que a previsão real está dentro do intervalo de previsão. Clique no botão Executar teste para encontrar a saída da previsão.

    Os valores que você precisa inserir para executar um teste de saída de previsão.

    Depois de executar o teste, as estatísticas de saída da previsão são exibidas. A estimativa de ponto na tela é um valor único em um ponto no tempo. Por exemplo, a restauração do banco de dados leva 134,47 segundos para ser concluída. Os limites inferior e superior na tela significam um valor de precisão de intervalo. Por exemplo, a restauração do banco de dados leva de 84,53 a 185,41 segundos para ser concluída.

    Os valores de saída de teste para as previsões de estimativa de ponto e precisão de intervalo.