Formulário de definição de semelhança

  • Versão de lançamento: Australia
  • Atualizado 12 de mar. de 2026
  • 3 min. de leitura
  • Use o formulário de Definição de semelhança em Espaço de conformidade para criar uma definição de semelhança para o mapeamento de conformidade regulatória.

    Formulário Definição de semelhança

    Para obter uma descrição dos valores de campo, consulte a tabela a seguir.
    Tabela 1. Formulário Definição de semelhança
    Campo Descrição
    Rótulo Nome exclusivo da solução de semelhança.
    Nome Nome da solução de semelhança. Este campo é definido automaticamente com o nome atribuído pelo sistema que é mais semelhante ao seu valor para Rótulo campo.
    Corpus de palavras Corpus de palavras existente que é relevante para sua solução. Para este caso de uso, selecione Word Corpus para atribuição de ocorrências corpus de palavras.
    Nota:
    Para corpora de palavras em soluções de semelhança, o número de registros de acordo com a tabela é limitado a 300 000.
    Tabela Tabela que contém os registros com os quais você deseja treinar e prever. Quando você atribui um valor de tabela, um link aparece no formulário. O link mostra o número de registros que correspondem às suas condições atuais.

    Para este caso de uso, o campo é definido automaticamente como [ sn_compliance_citation ]. Não modifique este campo para esta definição de solução.

    Campos Tipos de campo que provavelmente ajudarão a recomendar as citações. Você pode selecionar as colunas na tabela em Tabela para que seus dados ajudem a prever as citações com mais precisão. Neste caso de uso, o. Nome . Nome do documento , Descrição do documento e. Descrição os campos estão selecionados. Esses campos são os tipos de campo que contêm os registros de citação que você deseja recomendar.
    Nota:
    Você pode modificar os campos selecionados aqui se houver outros campos importantes não vazios no registro do problema em seu banco de dados, de modo que esses campos possam ajudar a descobrir citações semelhantes para mapeamento para os alertas regulatórios.
    Tabela de teste Tabela que contém as citações que você deseja prever. Para este caso de uso, o campo é definido automaticamente como o problema [ sn_grc_reg_change_regulatory_feed ].
    Nota:
    O número de registros que a janela de semelhança pode recuperar é limitado a 10. Este campo não deve ser modificado para esta definição de solução.
    Campos de Testes Campos usados como entrada durante a previsão. Neste caso de uso, selecione Título e. Descrição .
    Nota:
    Você pode modificar os campos selecionados aqui se houver outros campos importantes não vazios no registro do problema em seu banco de dados, de modo que esses campos possam ajudar a descobrir problemas semelhantes para prever os responsáveis pelo problema.
    Filtro Deixe este campo em branco.
    Idioma de processamento Idioma dominante do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for inglês, escolha Inglês .
    Por padrão, o processamento em inglês é aplicado a todos os conjuntos de dados. Por exemplo, se você selecionar Inglês , O sistema processa os dados em inglês e italiano.
    Nota:
    O termo processando indica algumas das etapas específicas do idioma que são usadas como parte do treinamento de uma solução. Essas etapas incluem tokenizar palavras, remover palavras de parada e stemming.
    Palavras irrelevantes Lista de palavras de interrupção. Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes que usa o mesmo idioma. Por exemplo, se o idioma de processamento for inglês, o. Palavras de interrupção padrão em inglês a opção é exibida. A lista de Palavras de interrupção padrão em inglês também aparece em sua seleção. Você pode adicionar sua própria lista personalizada de palavras de interrupção.
    Frequência de Treinamento Frequência de treinamento. A opção de retreinamento pode variar de 180 dias.
    Frequência de Atualização Frequência da frequência com que você deseja atualizar os dados usados para recuperar seus resultados de semelhança.

    Por exemplo, novas citações normalmente ocorrem com frequência ao longo do dia. Se você tiver novas citações, talvez queira selecionar uma frequência de atualização de A cada 15 minutos . Essa frequência pode aumentar a probabilidade de que novas citações sejam incluídas na atualização.