Criar e treinar uma solução de classificação

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 7 min. de leitura
  • Especifique os registros usados para treinar uma solução de classificação, quais campos acionam uma previsão e com que frequência você deseja treinar novamente sua solução.

    Antes de Iniciar

    Importante:
    Na versão Yokohama, os modelos nas estruturas de classificação, clustering e semelhança usam soluções de fluxo de trabalho. Eles são pré-treinados, portanto, um corpus de palavras não é necessário para suas novas soluções. Quando suas soluções existentes com um corpus de palavras são treinadas novamente após o upgrade, elas se tornam soluções de fluxo de trabalho e o campo Corpus de palavras é removido do formulário.

    Por Que e Quando Desempenhar Esta Tarefa

    Um modelo preditivo é tão bom quanto os dados que você usa para treiná-lo. Para selecionar registros apropriados para treinamento, examine o dicionário do banco de dados da tabela, bem como a qualidade atual dos valores de registro que você deseja usar.

    Para obter informações sobre como usar dados de treinamento criptografados, consulte Criptografia de dados na Inteligência preditiva.

    Para obter informações sobre o número mínimo e máximo de registros que você pode usar para treinamento, consulte Propriedades Inteligência preditiva.

    Nota:
    As classes que têm menos de 30 registros no conjunto de dados de treinamento são excluídas do treinamento da solução. Quando sua solução é treinada e concluída, todas as classes excluídas são listadas na seção Estatísticas da solução do formulário de Solução de ML.

    Todas as classes que foram excluídas do treinamento da solução são listadas na seção Estatísticas da solução do formulário Solução de ML da solução treinada.

    Você deve criar uma definição de solução separada para cada modelo preditivo ao qual deseja oferecer suporte. O procedimento a seguir explica como criar uma nova solução de classificação, mas você também pode copiar uma definição de solução existente e sua configuração para um novo registro selecionando Copiar definição de solução no menu de contexto. Edite os valores de campo no novo registro conforme necessário.

    Na versão Yokohama, você também pode criar uma solução de classificação de fluxo de trabalho usando um script se quiser incluir uma análise dos principais recursos que influenciam as previsões do modelo. Para obter mais informações, consulte Explicabilidade do modelo.

    Procedimento

    1. Verifique se você está no escopo da aplicação desejado para a definição da solução e navegue até Tudo > Inteligência preditiva > Classificação > Definições de solução.
    2. Na lista Definições de classificação, selecione Novo.
    3. No formulário Definição de classificação vazio, configure os campos de acordo com a orientação a seguir.
      Campo Valor
      Rótulo Insira um nome exclusivo para o registro da solução.
      Nome O sistema gera o valor deste campo somente leitura com base no valor do Rótulo que você inseriu.
      Corpus de palavras

      Selecione um corpus de palavras relevante para sua solução. Para obter mais informações, consulte Criar corpus de palavras.

      Nota:
      O Word Corpus não é um campo obrigatório para clientes que implementam Inteligência preditiva pela primeira vez a partir de Utah. Em vez disso, um modelo pré-treinado é usado. O campo Corpus de palavras é removido para modelos pré-treinados.
      Tabela Selecione a tabela que contém os registros de destino que você deseja que o sistema preveja.
      Campo de Saída

      Selecione o campo cujo valor você deseja que o modelo preditivo defina.

      Em geral, um bom campo de saída tem essas características.
      • É um campo de opção ou um campo de cadeia de caracteres com um conjunto finito de valores possíveis.
      • Ele tem alguma conexão causal com os campos de entrada.

      Por exemplo, na definição da solução de categorização de incidentes padrão, o campo de saída é definido como Categoria.

      Campos

      Selecione os campos de entrada que você deseja que a solução use para gerar uma previsão.

      Campos de entrada são campos em um registro que podem conter as informações de classificação de que sua solução de previsão precisa para ter sucesso. Por exemplo, se você estiver prevendo a classe correta para triar um registro de incidente, a previsão deverá coletar registros que contenham texto que faça referência à classe. A maioria dos registros tem texto contextual no campo Descrição resumida, portanto, é um ótimo campo de entrada para usar em geral. Você também pode usar Anotações de resolução como um campo de entrada, já que ele também pode fazer referência à classe de incidente nas anotações detalhadas do incidente.

      Em geral, os bons campos de entrada têm essas características.
      • Os campos estão disponíveis para os usuários ao criar registros.
      • O tipo de dados do campo pode ser cadeia de caracteres, referência, opção ou HTML. Quanto mais informações um campo fornecer, mais frequentemente uma solução poderá fazer uma previsão e mais frequentemente as previsões serão precisas.
      • O campo tem um valor padrão e não deve ficar em branco.

      Todas as definições de solução padrão usam o campo Descrição resumida.

      Filtro

      Clique em Adicionar condição de filtro para aplicar condições aos registros que você está treinando.

      Por exemplo, a definição da solução de categorização de incidentes usa um filtro com estas condições: [Criado][em][Últimos 12 meses] E [Ativo][é][falso] E [Estado][é um de][Resolvido | Fechado]

      Para treinar uma solução, o filtro deve retornar pelo menos um registro. Se o filtro não retornar registros, atualize-o até que ele retorne registros para treinamento.
      Nota:
      O número recomendado de registros para treinar uma boa solução é de 30.000 a 300.000. Se você enviar mais de 300.000 registros, os 300.000 registros mais recentes serão usados para treinar a solução. Use somente registros autênticos do banco de dados.
      Em geral, um bom filtro tem essas características.
      • Os registros de treinamento estão inativos e seus estados indicam o trabalho concluído em seu processo padrão, como resolvido ou encerrado.
      • Os campos de destino contêm somente valores corretos. Filtrar registros com valores de campo de destino não confiáveis. Por exemplo, se você estiver prevendo o grupo/categoria de atribuição e os dados históricos de incidentes contiverem grupos/categorias de atribuição que não são mais usados, adicione um filtro para remover esses registros do treinamento.
      • Os registros de treinamento contêm vários exemplos de cada valor de campo de destino que você deseja que a solução preveja.
      • Os registros de treinamento incluem variações comuns dos campos de entrada.

      Use filtros de data relativa, como últimos 3 meses ou últimos 12 meses. Não use datas codificadas porque esses filtros não são atualizados quando as soluções são treinadas novamente, a menos que você as atualize manualmente.

      Idioma de Processamento Selecione o idioma dominante do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha italiano. Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.
      Nota:
      O termo processamento indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Por exemplo, tokenizar palavras, remover palavras irrelevantes e truncar.
      Palavras irrelevantes Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes para esse idioma. Por exemplo, se o idioma de processamento for o italiano, a lista Palavras irrelevantes padrão em italiano será exibida. A lista Palavras irrelevantes padrão em inglês também está incluída. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicioná-la à sua solução.
      Frequência de Treinamento
      Selecione a frequência com que o sistema gera novamente a solução. As opções disponíveis variam de Executar uma vez até A cada 180 dias.
      Nota:
      O número mínimo de registros necessários para o treinamento da solução de classificação é definido como 10.000.

      Por padrão, o sistema executa o treinamento uma vez. Isso permite que você revise e atualize a definição da solução até que ela forneça valores aceitáveis de cobertura e precisão.

      Quando a definição da solução estiver razoavelmente estável, considere os treinamentos programados, pois os dados podem envelhecer com o tempo, prejudicando a precisão do modelo de previsão.

      Nota:
      O programador de ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento de ML por instância em uma janela de 24 horas. Este limite exclui solicitações de retreinamento programadas, atualizações de cluster e atualizações de semelhança, mesmo se as novas solicitações de treinamento excederem 50 em uma janela de 24 horas.
    4. Clique na opção ou botão apropriado do menu de contexto para a definição da solução.
      OpçãoDescrição
      Salvar ou Salvar e Treinar Salve seu registro de definição de solução para que você possa retornar mais tarde ou salve-o e envie-o para treinamento.
      Enviar ou Enviar e Treinar Crie seu registro de definição de solução e envie-o ou envie-o e treine-o.
    5. Se você enviou a solução para treinamento, clique em OK na janela Ativação de treinamento para confirmar.
      • O sistema programa a solução para treinamento com o serviço de treinamento mais próximo. O sistema envia uma notificação quando o treinamento é concluído, incluindo quaisquer erros que possam ter ocorrido no treinamento. Outros usuários podem assinar a categoria Inteligência preditiva Notificações. Quando o treinamento é concluído, o sistema carrega a solução como um registro de anexo.
      • Um gráfico de bolhas preenche a guia Visualização de solução do formulário de solução, mostrando a precisão e a cobertura estimadas para cada uma das classes cobertas pela solução. O tamanho da bolha indica a porcentagem de registros (distribuição) que pertencem à classe. Ao apontar para uma bolha, você pode ver sua cobertura estimada, precisão estimada e distribuição.
      A precisão e a cobertura estimadas para cada uma das classes cobertas pela solução.

    O que Fazer Depois

    Na seção Confiança de Classe da guia Estatísticas da Solução em sua solução, revise as estatísticas de precisão e cobertura da solução treinada.

    Na guia Testar soluções em sua solução, você pode testar a saída de previsão inserindo valores dos campos de entrada, como a Descrição resumida.

    Como testar a saída de previsão dos registros que você usou como entrada para a previsão inserindo valores dos campos de entrada, como a Descrição Resumida