Configurar o algoritmo do componente de conexão e o método de distância de Levenshtein para uma solução de cluster

Habilitar IA de Washington DC

Release

washingtondc

ft:locale

pt-BR

ft:publication_title

Habilitar IA de Washington DC

ft:clusterId

platai

bundleId

platai

workflow

Platform

Configurar o algoritmo do componente de conexão e o método de distância de Levenshtein para uma solução de cluster

Versão de lançamento: Washingtondc

Atualizado 1 de fev. de 2024

2 min. de leitura

Aplique a codificação do método Configurar Componente do Connect e Distância de Levenshtein para otimizar o treinamento para suas soluções de cluster.

Antes de Iniciar

Função necessária: admin ou ml_admin

Nota:

Definir configurações avançadas em suas soluções de ML é opcional. Se você optar por definir qualquer uma dessas configurações, certifique-se de estar bem informado sobre a tecnologia que está habilitando na solução e de ter um caso de uso que se beneficie do que a tecnologia oferece.

Crie e treine uma definição de solução de clustering ou use uma existente.
Função necessária: admin ou ml_admin

Por Que e Quando Desempenhar Esta Tarefa

Ao treinar soluções de clustering, você tem as três opções a seguir.

Use o algoritmo k-means padrão.
Use o parâmetro de solução DBSCAN opcional com o método de distância euclidiana como métrica.
Use os parâmetros de solução opcionais DBSCAN, Vizinhos mínimos e Distância de Levenshtein. O componente de conexão é habilitado por DBSCAN e Vizinhos mínimos e oferece suporte a texto baseado em vetor de parágrafo e texto baseado em distância de Levenshtein. Se você treinar sua solução usando o método Distância de Levenshtein, não precisará usar um corpus de palavras em sua solução de clustering.

Neste cenário de exemplo, você treina sua definição de solução usando a terceira opção referenciada acima.

Procedimento

Navegar até Todos > Predictive Intelligence > Clustering > Definições de solução.
Abra um formulário de definição de solução de clustering treinado.
Na guia Configurações avançadas da solução, na seção Links relacionados do formulário, clique em Novo.
Crie um registro de parâmetro.
1. No campo Parâmetros da solução, clique no ícone de pesquisa.
2. Na tela Parâmetros da solução ML, selecione Distância de Levenshtein.
Clique em Enviar.

A tela de registro da Configuração de solução avançada é atualizada.
Clique em Enviar.

Resultado: a distância de Levenshtein está configurada para sua solução de cluster. Seu parâmetro de solução aparece na guia Configurações de solução avançadas do formulário de definição de cluster.
Repita as etapas 1 a 6 do exemplo anterior de Distância de Levenshtein, exceto que desta vez você está criando os parâmetros de solução Vizinhos mínimos e DBSCAN, que juntos habilitam o recurso Componente de conexão.

Ao selecionar, configurar e enviar o parâmetro de solução Vizinhos mínimos, certifique-se de definir o campo Entradas do usuário com um valor de 1. Somente alguns parâmetros têm um campo de Entradas do usuário.

Resultado:

O componente do Connect está configurado para sua solução de cluster. Seus dois parâmetros de solução aparecem na guia Configurações de solução avançadas do formulário de definição de cluster, ao lado do parâmetro Distância de Levenshtein que você configurou nas etapas 1 a 6 deste procedimento.