Criar e treinar uma solução de classificação

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 8 min. de leitura
  • Especifique os registros usados para treinar uma solução de classificação, quais campos acionam uma previsão e com que frequência você deseja retreinar sua solução.

    Antes de Iniciar

    • Crie uma lista de palavras irrelevantes personalizadas.
    • Função necessária: admin ou ml_admin

    Por Que e Quando Desempenhar Esta Tarefa

    Inteligência preditiva oferece suporte a soluções de treinamento em que os dados de origem são protegidos por esses tipos de criptografia.
    • FDE (criptografia completa de disco).
    • Column Level Encryption. Ao usar o Column Level Encryption, certifique-se de que o usuário sharedservice.worker tenha a mesma função de módulo de criptografia que foi usada para criptografia.
    Nota:
    Inteligência preditiva não é compatível com soluções de treinamento em que os dados de origem são criptografados pelo Edge Encryption.

    Um modelo preditivo é tão bom quanto os dados usados para treiná-lo. Para selecionar registros de treinamento apropriados, familiarize-se com o dicionário de banco de dados da tabela, bem como com a qualidade atual dos valores de registro que você deseja usar.

    Você deve criar um registro de definição de solução separado para cada modelo preditivo para o qual deseja oferecer suporte. Você pode copiar um registro de definição de solução e sua configuração para um novo formulário clicando em Copiar definição de solução no menu de contexto. Você pode usar o novo registro para fazer mais atualizações de solução sem reconfigurar toda a definição de solução.

    Nota:
    As classes que têm menos de 30 registros no conjunto de dados de treinamento são excluídas do treinamento da solução. Quando sua solução estiver treinada e concluída, todas as classes excluídas serão listadas na seção Estatísticas da solução do formulário de Solução de ML.

    Todas as classes que foram excluídas do treinamento da solução são listadas na seção Estatísticas da solução do formulário de Solução de ML da solução treinada.

    Procedimento

    1. Navegar até Todos > Predictive Intelligence > Classificação > Definições de solução.
    2. Na lista Definições de classificação, clique em Novo.
    3. No formulário de definição de classificação vazio, configure esses campos de acordo com a orientação a seguir.
      Campo valor
      Rótulo Insira um nome exclusivo para o registro da solução.
      Nome O sistema gera o valor deste campo somente leitura com base no valor do Rótulo que você inseriu.
      Corpus de palavras

      Selecione um corpus de palavras existente que seja relevante para sua solução. Por exemplo, neste caso de uso, você seleciona um corpus de palavras que tem um título como Incidentes nos últimos 3 meses.

      Se você não tiver um corpus de palavras relevante, siga as etapas para criar um corpus de palavras primeiro. Quando o corpus de palavras estiver completo, você poderá selecioná-lo no campo Corpus de palavras no formulário de Definição de classificação.

      Nota:
      Corpus de palavras não é um campo obrigatório para clientes que implementam Inteligência preditiva pela primeira vez a partir de Utah. Um modelo pré-treinado é usado.
      Tabela Selecione a tabela que contém os registros de destino que você deseja que o sistema preveja.
      Campo de Saída

      Selecione o campo cujo valor você deseja que o modelo preditivo defina.

      Em geral, um bom campo de saída tem essas características.
      • É um campo de opção ou um campo de cadeia de caracteres com um conjunto finito de valores possíveis.
      • Ele tem alguma conexão casual com os campos de entrada.

      Por exemplo, a definição de solução de categorização de incidentes padrão usa o campo Categoria como campo de saída.

      Campos

      Selecione os campos de entrada que você deseja que a solução use para gerar uma previsão.

      Campos de entrada são campos em um registro que podem conter as informações de classificação de que sua solução de previsão precisa para ter sucesso. Por exemplo, se você estiver prevendo a classe correta para fazer a triagem de um registro de incidente, a previsão deverá coletar registros que contenham texto que faça referência à classe. A maioria dos registros tem texto contextual no campo Descrição resumida, portanto, é um ótimo campo de entrada para usar em geral. Você também pode usar anotações de resolução como um campo de entrada, já que ele também pode fazer referência à classe de incidente nas anotações detalhadas do incidente.

      Em geral, os bons campos de entrada têm essas características.
      • Os campos estão disponíveis para os usuários ao criar registros.
      • O tipo de dados do campo pode ser cadeia de caracteres, referência, opção ou HTML. Quanto mais informações um campo fornece, mais frequentemente uma solução pode fazer uma previsão e mais frequentemente as previsões são precisas.
      • O campo tem um valor padrão e não deve ficar em branco.

      Todas as definições de solução padrão usam o campo Descrição resumida.

      Filtro

      Clique em Adicionar condição do filtro para aplicar condições aos registros que você está treinando.

      Por exemplo, a definição da solução Categorização de incidentes usa um filtro com estas condições: [Criado][em][Últimos 12 meses] E [Ativo][é][falso] E [Estado][é um de][Resolvido | Encerrado]

      Para treinar uma solução, o filtro deve retornar pelo menos um registro. Se o filtro não retornar registros, atualize-o até que ele retorne registros para treinamento.
      Nota:
      O número recomendado de registros para treinar uma boa solução é de 30.000 a 300.000. Se você enviar mais de 300.000 registros, os 300.000 registros mais recentes serão usados para treinar a solução. Use somente registros autênticos do banco de dados.
      Uma solução é tão boa quanto os dados usados para treiná-la. Em geral, um bom filtro tem essas características.
      • Os registros de treinamento estão inativos e têm estados de tarefa que representam a conclusão do trabalho em seu processo padrão, como resolvido ou encerrado.
      • Os registros de treinamento contêm somente valores corretos para o campo de destino. Filtre os registros com valores de campo de destino não confiáveis. Por exemplo, se você estiver prevendo o grupo/categoria de atribuição e tiver grupos/categorias de atribuição em seus dados históricos de incidentes que não são mais usados, adicione um filtro para remover esses registros de incidentes do treinamento.
      • Os registros de treinamento contêm vários exemplos de cada valor de campo de destino que você deseja que a solução preveja.
      • Os registros de treinamento incluem variações comuns dos campos de entrada.

      Não use datas codificadas como filtros, pois esses filtros não são atualizados quando as soluções são treinadas novamente, a menos que você os atualize manualmente antes de cada retreinamento. Em vez disso, use filtros de data relativa, como últimos 3 meses, últimos 6 meses e últimos 12 meses.

      Idioma de processamento Selecione o idioma dominante do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha italiano. Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.
      Nota:
      O termo processamento indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Por exemplo, tokenizar palavras, remover palavras irrelevantes e truncar.
      Palavras irrelevantes Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes que usa o mesmo idioma. Por exemplo, se o idioma de processamento for o italiano, a lista Palavras irrelevantes padrão em italiano será exibida. A lista Palavras irrelevantes padrão em inglês também aparece na sua seleção. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicioná-la à sua solução.
      Frequência de Treinamento
      Selecione a frequência com que o sistema gera novamente a solução com base nos registros que correspondem ao filtro. Suas opções incluem:
      • Executar uma vez
      • A cada 30 dias
      • A cada 60 dias
      • A cada 90 dias
      • A cada 120 dias
      • A cada 180 dias
      Nota:
      O número mínimo de registros necessários para o treinamento da solução de classificação é definido em 10.000.

      Por padrão, o sistema executa o treinamento uma vez. Esta prática fornece tempo para revisar e atualizar a definição da solução conforme necessário até que ela forneça valores de cobertura e precisão aceitáveis.

      Quando a definição da solução estiver razoavelmente estável, considere os treinamentos programados, pois os dados podem envelhecer com o tempo, degradando a precisão do modelo de previsão.

      Nota:
      O programador de ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento de ML por instância em uma janela de 24 horas. Este limite exclui solicitações de retreinamento programadas, atualizações de cluster e atualizações de semelhança, mesmo que as novas solicitações de treinamento excedam 50 em uma janela de 24 horas.
    4. Clique na opção de menu de contexto ou no botão apropriado para a definição da sua solução.
      OpçãoDescrição
      Salvar ou Salvar e Treinar Salve seu registro de definição de solução para poder retornar a ele mais tarde ou salve-o e envie-o para treinamento.
      Enviar ou Enviar e Treinar Crie seu registro de definição de solução e envie-o ou envie-o e treine-o.
    5. Se você enviou a solução para treinamento, clique em OK na janela de ativação de treinamento para confirmar.
      • O sistema programa a solução para treinamento com o serviço de treinamento mais próximo. O sistema envia uma notificação quando o treinamento é concluído, incluindo todos os erros que podem ter ocorrido no treinamento. Todos os outros usuários podem assinar a categoria Notificações Inteligência preditiva. Quando o treinamento é concluído, o sistema carrega a solução como um registro de anexo.
      • Um gráfico de bolha preenche a guia Visualização da solução do formulário da solução, mostrando a precisão estimada e a cobertura de cada uma das classes cobertas pela solução. O tamanho da bolha indica a % de registros (distribuição) que pertencem à classe. Ao apontar para uma bolha, você pode ver sua cobertura estimada, precisão estimada e distribuição.
      A precisão estimada e a cobertura para cada uma das classes cobertas pela solução.

    O que Fazer Depois

    Na seção Confiança de classe da guia Estatísticas da solução em sua solução, revise as estatísticas de cobertura e precisão da solução treinada.

    Na guia Testar soluções em sua solução, você pode testar a saída da previsão inserindo valores dos campos de entrada, como a Descrição resumida.

    Como testar a saída de previsão dos registros usados como entrada para a previsão inserindo valores dos campos de entrada, como a Descrição resumida