Criar e treinar uma solução de regressão

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 7 min. de leitura
  • Treine sua solução usando dados históricos para prever saídas numéricas, como uma temperatura ou um preço de ação. Por exemplo, você pode usar regressão para estimar o tempo necessário para resolver um incidente ou um caso.

    Antes de Iniciar

    Importante:
    O suporte para novas soluções de regressão foi descontinuado no Zurich versão. Você ainda poderá editar e treinar as soluções existentes, mas não poderá criar novas.

    Função necessária: Ml_admin ou admin

    Por Que e Quando Desempenhar Esta Tarefa

    As soluções de regressão permitem prever uma estimativa de pontos e um intervalo de previsão. O modelo resultante fornece as seguintes estatísticas:
    • Erro absoluto médio (MAE), que mede o desvio médio de um valor previsto em relação ao valor real. Essa métrica é útil, pois é fácil de entender, pois sua escala é igual à de seu destino. No entanto, o MAE é ilimitado, o que dificulta a comparação entre modelos.
    • Média simétrica de erro de porcentagem absoluta (SMAPE) é um valor percentual do desvio do previsto para o real. SMAPE é uma versão limitada do MAE, exceto que tem um intervalo de valores entre 0 e 100. Menor o valor de SMAPE, melhor a precisão do modelo.
    • Precisão do intervalo é a porcentagem de valores reais entre um intervalo previsto. Em outras palavras, é o intervalo entre os limites superior e inferior da previsão. Por exemplo, se quatro de cinco reais estiverem dentro do intervalo previsto, a precisão do intervalo será de 80%.
    • Largura média do intervalo é a diferença entre os limites superior e inferior da previsão. Esta métrica explica o quão informativo é o intervalo. Menor a largura média, melhor será o modelo

    Ao fazer previsões, a regressão também permite especificar um nível de confiança para o intervalo de previsão (intervalo).

    Neste procedimento de exemplo, você cria e treina uma definição de solução de regressão para prever o tempo necessário para restaurar um banco de dados em nuvem.

    Procedimento

    1. Navegar até Tudo > Inteligência preditiva > Regressão > Definições de solução.
    2. Na lista Definições de regressão, clique em Novo .
    3. No formulário Definição de regressão, configure esses campos de acordo com a orientação a seguir.
      Campo Valor
      Rótulo Insira um nome exclusivo para sua solução de regressão. Neste caso de uso, você pode inserir Teste de regressão para restauração de banco de dados .
      Nome Ao inserir o valor do rótulo da solução, este campo será preenchido automaticamente com um nome atribuído pelo sistema semelhante ao valor do rótulo.
      Corpus de palavras

      Selecione um corpus de palavras existente que seja relevante para sua solução. Por exemplo, neste caso de uso, você seleciona um corpus de palavras que tenha um título como Incidentes nos últimos 3 meses .

      Se você não tiver um corpus de palavras relevante, siga as etapas para criar um corpus de palavras primeiro. Quando o corpus de palavras estiver concluído, você poderá selecioná-lo no campo Corpus de palavras no formulário Definição de regressão.

      No entanto, a seleção de corpus de palavras é opcional. Se os dados de entrada tiverem colunas de texto e você não escolher um corpus de palavras, sua solução de regressão treinará um novo modelo de corpus de palavras usando as colunas de texto em seus dados de entrada. O corpus de palavras resultante pode ser reutilizado em qualquer outra solução de regressão ou outro tipo de solução DE ML.

      Nota:
      Um modelo pré-treinado é usado em vez do Corpus de palavras para usuários que ativaram Inteligência preditiva a partir de Utah.
      Tabela Selecione a tabela do banco de dados na qual você está aplicando a regressão. A tabela deve conter registros históricos que o sistema pode usar para prever a duração da restauração do banco de dados.
      Campo de Saída

      Selecione o campo cujo valor você deseja que o modelo preditivo defina.

      Em geral, um bom campo de saída é numérico, inteiro ou de ponto flutuante.

      Neste cenário de exemplo, você usa Duração campo para medir um período de tempo. O campo de saída deve gerar um valor numérico.

      Campos Selecione um ou mais tipos de campo que ajudem o sistema a identificar os registros que você deseja treinar usando regressão. Neste cenário de exemplo, você usa Descrição resumida , Datacenter de origem , Datacenter de destino e Tamanho do banco de dados . (Short_description, Sourcedc, Targetdc e Dbsize.) Os tipos de campo de entrada podem ser cadeia de caracteres, nominal ou numérico.
      Filtrar (Opcional) Adicione condições de filtro aos registros de campo de saída que você deseja treinar usando regressão.
      Nota:
      • O número mínimo de registros para treinamento de regressão é de 10 000 registros.
      • O número máximo de registros para treinamento de regressão é limitado a 300 000.
      Idioma de processamento Selecione o idioma primário do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha Italiano . Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.
      Nota:
      O termo processando indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Essas etapas incluem tokenizar palavras, remover palavras irrelevantes e stemming.
      Palavras irrelevantes Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes que usa o mesmo idioma. Por exemplo, se o idioma de processamento for italiano, o Palavras irrelevantes padrão em italiano a lista é exibida. . Palavras irrelevantes padrão em inglês a lista também é exibida em sua seleção. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicioná-la à sua solução. Neste cenário, você usa o. Palavras irrelevantes padrão em inglês lista.
      Frequência de treinamento
      Selecione a frequência com que o sistema gera novamente a solução com base nos registros correspondentes a. Filtro . Suas opções incluem:
      • Executar uma vez
      • A cada 30 dias
      • A cada 60 dias
      • A cada 90 dias
      • A cada 120 dias
      • A cada 180 dias

      Neste cenário, você seleciona a cada 30 dias

      Por padrão, o sistema executa o treinamento uma vez. Esta prática fornece tempo para revisar e atualizar a definição da solução conforme necessário até que ela forneça cobertura aceitável e valores de precisão.

      Nota:
      • O número mínimo de registros necessários para o treinamento da solução de regressão é definido como 10 000.
      • O programador DE ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento DE ML por instância em uma janela de 24 horas. Este limite exclui solicitações programadas para retreinamento. Além disso, as atualizações de cluster e semelhança também são excluídas desse limite, mesmo que as novas solicitações de treinamento excedam 50 em uma janela de 24 horas.
    4. Clique no botão ou opção de menu de contexto apropriado para a definição da solução.
      OpçãoDescrição
      Salvar ou Salvar e treinar Salve o registro de definição da solução para retornar a ele mais tarde ou salvá-lo e enviá-lo para treinamento.
      Enviar ou Enviar e treinar Crie seu registro de definição de solução e envie-o ou envie-o e treine-o.
    5. Se você enviou a solução para treinamento, clique em OK em Ativação de treinamento janela para confirmar.

      O sistema programa a solução para treinamento com o serviço de treinamento mais próximo. O sistema envia uma notificação quando o treinamento é concluído, incluindo quaisquer erros que possam ter ocorrido no treinamento. Quaisquer outros usuários podem assinar o Inteligência preditiva Categoria de notificações. Quando o treinamento é concluído, o sistema carrega a solução como um registro de anexo.

    O que Fazer Depois

    Neste cenário de exemplo, você criou uma solução DE ML a partir da sua definição de solução. As guias Estatísticas da solução, Solução de teste e Definição da solução aparecem na seção Links relacionados da sua solução de ML.

    Na guia Estatísticas da solução, revise as estatísticas Estimativa de pontos e Intervalo (intervalo de previsão) geradas por sua solução.

    As estatísticas de previsão da solução que você criou e treinou.

    Na guia Testar soluções da sua solução, você pode testar a saída de previsão para os registros usados como entrada para a previsão inserindo valores para os campos de entrada, como Datacenter de origem , Datacenter de destino e Tamanho do banco de dados . Você também pode usar o nível de confiança de previsão padrão de 95 ou insira um nível diferente entre 0 e. 100 . Usar 95 como o valor significa que o sistema está 95% confiante de que a previsão real está dentro do intervalo de previsão. Clique em Executar teste botão para encontrar a saída de previsão.

    Os valores que você precisa inserir para executar um teste de saída de previsão.

    Depois de executar o teste, as estatísticas de saída de previsão serão exibidas. A estimativa de ponto na tela é um valor único em um ponto no tempo. Por exemplo, a restauração do banco de dados leva 134,47 segundos para ser concluída. Os limites inferior e superior na tela significam um valor de precisão de intervalo. Por exemplo, a restauração do banco de dados leva de 84,53 a 185,41 segundos para ser concluída.

    Os valores de saída de teste para a estimativa de ponto e as previsões de precisão de intervalo.