| Rótulo |
Insira um nome exclusivo para sua solução de clustering. Por exemplo, neste caso de uso, você pode inserir Incidentes de grupo em um Incidente grave. |
| Nome |
Conforme você insere o rótulo da solução, este campo é preenchido automaticamente com um nome atribuído pelo sistema com base no valor do rótulo. |
| Corpus de palavras |
Se você tiver uma solução de cluster legada, poderá selecionar um corpus de palavras relevante no campo Corpus de palavras no formulário de definição.
Nota: Com a versão Xanadu, um corpus de palavras não é necessário, porque um modelo pré-treinado é usado. O campo Corpus de palavras não está visível no formulário de definição para modelos pré-treinados.
Para obter mais informações, consulte Criar corpus de palavras.
|
| Tabela |
Selecione a tabela que contém os tipos de registro que você deseja agrupar em um ou mais clusters. Por exemplo, neste caso de uso, você seleciona a tabela Incidente [incident], pois ela contém registros de incidentes que você deseja agrupar para uma análise de incidente grave.
Quando você atribui um valor de tabela, um link aparece no formulário que mostra o número de registros que correspondem às condições atuais.
|
| Campos |
Selecione um ou mais tipos de campos de entrada que ajudam o sistema a identificar os registros que você deseja incluir no cluster. Neste caso de uso, use Descrição resumida.
Nota: Ao selecionar um campo de tipo de referência, você deve fazer referência com pontos até o nome da propriedade do campo. Por exemplo, em vez de short_description, insira short_description.name.
|
| Usar Grupo por |
Marque esta caixa de seleção somente se quiser agrupar registros de entrada por um campo antes de criar clusters.Nota: Marcar esta caixa de seleção ativa a lista Agrupar por. Se você não marcar a caixa de seleção, todos os registros da tabela serão agrupados em clusters. |
| Agrupar por |
A seleção de um valor nesta lista é opcional. Se você fizer isso, o sistema agrupará os registros em um ou mais clusters com base em sua seleção.
|
| Campos da Pureza |
Escolha campos da tabela que possam ajudar o sistema a identificar a classe mais frequente no cluster. Neste cenário de exemplo, selecione Categoria e Grupo de atribuição.Nome. |
| Filtrar |
Adicione condições de filtro a serem aplicadas aos registros de campo de entrada que você deseja incluir em seus clusters. O número de registros para clustering é limitado a 300.000. Nota: As inclusões de script não podem ser referenciadas no filtro. Use exibições de banco de dados como alternativa. |
| Idioma de processamento |
Selecione o idioma dominante do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha italiano. Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.Nota: O termo processamento indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Por exemplo, tokenizar palavras, remover palavras irrelevantes e truncar. |
| Palavras irrelevantes |
Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes nesse idioma. Por exemplo, se o idioma de processamento for o italiano, a lista Palavras irrelevantes padrão em italiano será exibida. A lista Palavras irrelevantes padrão em inglês também está incluída. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicioná-la à sua solução. |
| Frequência de Atualização |
Selecione com que frequência você deseja que o sistema atualize seus clusters com registros novos e atualizados. Nota: O sistema extrai registros com base nas condições do filtro Agrupar por que você define na solução de cluster, se houver.
Por exemplo, se você selecionar A cada 15 minutos, o sistema identificará quais registros chegaram dentro desse intervalo de tempo. O sistema tenta atribuí-los aos clusters existentes ou cria um novo cluster, se possível.
Neste exemplo, chegam 20 novos registros. Se 16 desses registros entrarem em um cluster existente e 4 não, o sistema formará um novo cluster para os quatro registros não atribuídos.
Você também pode optar por não atualizar seus clusters.
|
| Frequência de Treinamento |
Selecione com que frequência você deseja que o sistema descarte todos os resultados de cluster anteriores e recrie os clusters desde o início. As opções variam de diariamente, a cada três dias, a cada sete dias ou mensalmente. Você também pode optar por treinar o cluster uma vez.Nota: O programador de ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento de ML por instância em uma janela de 24 horas. O limite exclui solicitações de retreinamento programadas. Além disso, as atualizações de clustering e semelhança também são excluídas deste limite, mesmo se as novas solicitações de treinamento excederem 50 em uma janela de 24 horas. |
| Número mínimo de registros por cluster |
Insira o número mínimo de registros que você deseja que um cluster contenha. O valor inserido deve ser 2 ou superior. |