Configurar o algoritmo do componente de conexão e o método de distância de Levenshtein para uma solução de cluster

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 2 min. de leitura
  • Aplique a codificação do método Configurar Componente do Connect e Distância de Levenshtein para otimizar o treinamento para suas soluções de cluster.

    Antes de Iniciar

    Função necessária: admin ou ml_admin
    Nota:
    Definir configurações avançadas em suas soluções de ML é opcional. Se você optar por definir qualquer uma dessas configurações, certifique-se de estar bem informado sobre a tecnologia que está habilitando na solução e de ter um caso de uso que se beneficie do que a tecnologia oferece.
    • Crie e treine uma definição de solução de clustering ou use uma existente.
    • Função necessária: admin ou ml_admin

    Por Que e Quando Desempenhar Esta Tarefa

    Ao treinar soluções de clustering, você tem as três opções a seguir.

    • Use o algoritmo k-means padrão.
    • Use o parâmetro de solução DBSCAN opcional com o método de distância euclidiana como métrica.
    • Use os parâmetros de solução opcionais DBSCAN, Vizinhos mínimos e Distância de Levenshtein. O componente de conexão é habilitado por DBSCAN e Vizinhos mínimos e oferece suporte a texto baseado em vetor de parágrafo e texto baseado em distância de Levenshtein. Se você treinar sua solução usando o método Distância de Levenshtein, não precisará usar um corpus de palavras em sua solução de clustering.

    Neste cenário de exemplo, você treina sua definição de solução usando a terceira opção referenciada acima.

    Procedimento

    1. Navegar até Todos > Predictive Intelligence > Clustering > Definições de solução.
    2. Abra um formulário de definição de solução de clustering treinado.
    3. Na guia Configurações avançadas da solução, na seção Links relacionados do formulário, clique em Novo.
      Esta imagem mostra como selecionar a opção Parâmetros da solução para criar o parâmetro.
    4. Crie um registro de parâmetro.
      1. No campo Parâmetros da solução, clique no ícone de pesquisa.
      2. Na tela Parâmetros da solução ML, selecione Distância de Levenshtein.
      Como criar o registro de parâmetro selecionando o botão Pesquisar e, em seguida, selecionando a Descrição resumida da chave de distância de Levenshtein.
    5. Clique em Enviar.

      A tela de registro da Configuração de solução avançada é atualizada.

      O novo registro de parâmetro da solução que você cria a partir dos valores que acabou de atribuir.

    6. Clique em Enviar.

      Resultado: a distância de Levenshtein está configurada para sua solução de cluster. Seu parâmetro de solução aparece na guia Configurações de solução avançadas do formulário de definição de cluster.

      Quando você envia o registro que criou, o parâmetro de solução Distância de Levenshtein aparece no formulário de definição de solução de clustering.
    7. Repita as etapas 1 a 6 do exemplo anterior de Distância de Levenshtein, exceto que desta vez você está criando os parâmetros de solução Vizinhos mínimos e DBSCAN, que juntos habilitam o recurso Componente de conexão.
      Os dois parâmetros de solução restantes que você precisa adicionar à sua solução de cluster. Esses dois parâmetros finais habilitam o recurso Connect Component.

      Ao selecionar, configurar e enviar o parâmetro de solução Vizinhos mínimos, certifique-se de definir o campo Entradas do usuário com um valor de 1. Somente alguns parâmetros têm um campo de Entradas do usuário.

      Como adicionar um valor ao campo Entradas do usuário para o parâmetro Vizinhos mínimos. Neste cenário, você insere um valor de 1.

      Resultado:

      O componente do Connect está configurado para sua solução de cluster. Seus dois parâmetros de solução aparecem na guia Configurações de solução avançadas do formulário de definição de cluster, ao lado do parâmetro Distância de Levenshtein que você configurou nas etapas 1 a 6 deste procedimento.

      Os três parâmetros de solução que você configurou na seção Configurações de solução avançadas da sua solução de clustering.