Configurar o algoritmo do componente de conexão e o método de distância de Levenshtein para uma solução de cluster
Aplique a codificação do método Configurar Componente do Connect e Distância de Levenshtein para otimizar o treinamento para suas soluções de cluster.
Antes de Iniciar
Nota:
Definir configurações avançadas em suas soluções de ML é opcional. Se você optar por definir qualquer uma dessas configurações, certifique-se de estar bem informado sobre a tecnologia que está habilitando na solução e de ter um caso de uso que se beneficie do que a tecnologia oferece.
- Crie e treine uma definição de solução de clustering ou use uma existente.
- Função necessária: admin ou ml_admin
Por Que e Quando Desempenhar Esta Tarefa
Ao treinar soluções de clustering, você tem as três opções a seguir.
- Use o algoritmo k-means padrão.
- Use o parâmetro de solução DBSCAN opcional com o método de distância euclidiana como métrica.
- Use os parâmetros de solução opcionais DBSCAN, Vizinhos mínimos e Distância de Levenshtein. O componente de conexão é habilitado por DBSCAN e Vizinhos mínimos e oferece suporte a texto baseado em vetor de parágrafo e texto baseado em distância de Levenshtein. Se você treinar sua solução usando o método Distância de Levenshtein, não precisará usar um corpus de palavras em sua solução de clustering.
Neste cenário de exemplo, você treina sua definição de solução usando a terceira opção referenciada acima.