| Rótulo |
Insira um nome exclusivo para sua solução de cluster. Neste caso de uso, você pode inserir Agrupar incidentes em um incidente grave. |
| Nome |
Ao inserir o rótulo da solução, este campo é preenchido automaticamente com um nome atribuído pelo sistema com base no valor do rótulo. |
| Corpus de palavras |
Se você tiver uma solução de cluster legada, poderá selecionar um corpus de palavras relevante no Corpus de palavras campo no formulário de definição.
Nota: Com Zurich um corpus de palavras não é necessário, porque um modelo pré-treinado é usado. . Corpus de palavras o campo não está visível no formulário de definição para modelos pré-treinados.
Para obter mais informações, consulte Crie um corpus de palavras.
|
| Tabela |
Selecione a tabela que contém os tipos de registro que você deseja agrupar em um ou mais clusters. Por exemplo, neste caso de uso, você seleciona Incidente [incidente] tabela, pois contém registros de incidentes que você deseja agrupar para uma análise de incidente grave.
Quando você atribui um valor de tabela, um link aparece no formulário que mostra o número de registros que correspondem às suas condições atuais.
|
| Campos |
Selecione um ou mais tipos de campos de entrada que ajudam o sistema a identificar os registros que você deseja incluir no cluster. Neste caso de uso, use Descrição resumida .
Nota: Ao selecionar um campo de tipo de referência, você deve fazer referência com pontos até o nome da propriedade do campo. Por exemplo, em vez de short_description insira short_description.name .
|
| Usar Grupo por |
Marque esta caixa de seleção somente se quiser agrupar registros de entrada por um campo antes de criar clusters.Nota: Marcar esta caixa de seleção ativa Agrupar por lista. Se você não marcar a caixa de seleção, todos os registros de tabela serão agrupados em clusters. |
| Agrupar por |
Selecionar um valor nesta lista é opcional. Se você fizer isso, o sistema agrupará registros em um ou mais clusters com base em sua seleção.
|
| Campos da Pureza |
Escolha campos da tabela que podem ajudar o sistema a identificar a classe mais frequente no cluster. Neste cenário de exemplo, selecione Categoria e. Grupo de atribuição.Nome . |
| Filtrar |
Adicione condições de filtro a serem aplicadas aos registros de campo de entrada que você deseja incluir em seus clusters.
- O número máximo de registros para cluster é limitado a 300 000.
- Para obter melhores resultados, procure pelo menos 2000 registros como mínimo.
Nota: As inclusões de script não podem ser referenciadas no filtro. Use exibições de banco de dados como alternativa. |
| Idioma de processamento |
Selecione o idioma dominante do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for italiano, escolha Italiano . Além disso, o processamento em inglês é aplicado a todos os conjuntos de dados por padrão. Por exemplo, se você selecionar italiano, o sistema processará os dados em inglês e italiano.Nota: O termo processando indica algumas das etapas específicas do idioma usadas como parte do treinamento de uma solução. Por exemplo, tokenizar palavras, remover palavras irrelevantes e stemming. |
| Palavras irrelevantes |
Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de Palavras irrelevantes nesse idioma. Por exemplo, se o idioma de processamento for o italiano, a lista Palavras irrelevantes padrão em italiano será exibida. . Palavras irrelevantes padrão em inglês a lista também está incluída. Se você criar uma lista de palavras irrelevantes personalizada, poderá selecioná-la no campo Palavras irrelevantes para adicionar à sua solução. |
| Frequência de atualização |
Selecione a frequência com que você deseja que o sistema atualize seus clusters com registros novos e atualizados. Nota: O sistema extrai registros com base nas condições de filtro Agrupar por que você definiu em sua solução de cluster, se houver.
Por exemplo, se você selecionar A cada 15 minutos , o sistema identifica quais registros chegaram dentro desse intervalo de tempo. O sistema tenta atribuí-los aos clusters existentes ou cria um novo cluster, se possível.
Neste exemplo, chegam 20 novos registros. Se 16 desses registros entrarem em um cluster existente e 4 não, o sistema criará um novo cluster para os quatro registros não atribuídos.
Você também pode optar por não atualizar seus clusters.
|
| Frequência de treinamento |
Selecione com que frequência você deseja que o sistema descarte todos os resultados de cluster anteriores e recrie os clusters desde o início. Suas opções variam de diariamente, a cada três dias, a cada sete dias ou mensalmente. Você também pode optar por treinar seu cluster uma vez.Nota: O programador DE ML limita o número de treinamentos que uma instância pode confirmar a 50 novas solicitações de treinamento DE ML por instância em uma janela de 24 horas. O limite exclui solicitações de retreinamento programadas. Além disso, as atualizações de cluster e semelhança também são excluídas desse limite, mesmo que as novas solicitações de treinamento excedam 50 em uma janela de 24 horas. |
| Número mínimo de registros por cluster |
Insira o número mínimo de registros que você deseja que um cluster contenha. O valor inserido deve ser 2 ou superior. |