Criar um corpus de palavras

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 4 min. de leitura
  • Crie uma coleção de palavras e frases que funcione como o vocabulário que o sistema usa para comparar seus registros de instância com base na semelhança textual. Você pode pensar no corpus de palavras como um dicionário que deseja que o sistema de aprendizado de máquina entenda.

    Antes de Iniciar

    Função necessária: ml_admin ou admin

    Por Que e Quando Desempenhar Esta Tarefa

    Importante:
    Com a versão Washington DC, os modelos de cluster e de semelhança usam soluções de fluxo de trabalho. Eles são pré-treinados, portanto, um corpus de palavras não é necessário para suas novas soluções. Quando suas soluções existentes com um corpus de palavras são treinadas novamente após a atualização, elas se tornam soluções de fluxo de trabalho e o campo Corpus de palavras é removido do formulário.

    As informações a seguir são fornecidas para o contexto legado.

    O objetivo primário de um corpus de palavras é inferir dados textuais para treinar seu modelo NLU. Se estiver usando um corpus de palavras em uma solução, você deverá especificá-lo para treinamento na fase de definição da solução de uma solução. Um corpus de palavras treinado pode ser reutilizado em soluções e recursos.

    Você pode usar um corpus de palavras para ajudar a comparar um texto de registro semelhante em uma tabela ou em várias tabelas. Um corpus de palavras também pode ser útil em outros cenários, como clustering, em que você agrupa registros semelhantes para análise de dados, reutilização ou revisão. Os itens adicionados ao seu corpus devem ser específicos da sua empresa e do seu setor para que você possa reutilizá-los em outras soluções de semelhança ou de cluster e aplicá-los a vários casos de uso.

    Neste procedimento de exemplo, você está trabalhando em registros de incidentes e deseja localizar artigos relevantes da base de conhecimento (KB) que podem fornecer resoluções para esses casos de incidentes. Seu objetivo aqui é criar um corpus de palavras que você pode aplicar a uma nova solução de semelhança que compara incidentes ativos com artigos da base de conhecimento publicados.

    Procedimento

    1. Navegar até Todos > Predictive Intelligence > Corpus de palavras.
    2. No formulário Corpus de palavras, clique em Novo.
    3. Configure esses campos de acordo com a orientação a seguir.
      Campo Descrição
      Nome Um título exclusivo que faz referência ao conteúdo do seu corpus. Por exemplo, neste caso de uso, você pode inserir um nome como Incidentes ativos e Bases de conhecimento publicadas, já que o nome indica as tabelas que seu corpus minerará para ajudar a criar sua solução.
      Ativo Marque esta caixa de seleção se você estiver criando vários corpus de palavras de uma vez e planejar configurar seus componentes de detalhe mais tarde. Caso contrário, deixe-o em branco, pois você poderá selecioná-lo em uma etapa posterior.
    4. Clique em Enviar.
    5. Na exibição de lista do Corpus de palavras, localize seu novo corpus de palavras e clique no valor Nome para abrir o registro.
    6. Na seção Conteúdo do corpus de palavras, clique em Novo.
    7. No formulário Conteúdo do corpus de palavras, configure esses campos de acordo com a orientação a seguir para definir um componente de conteúdo para o seu corpus de palavras.
      Campo Descrição
      Nome Insira um título que faça referência aos dados que você deseja adicionar ao seu corpus, como Incidentes encerrados nos últimos 6 meses.
      Tabela Selecione a tabela que contém os dados que você deseja incluir no corpus de palavras. Para este caso de uso, selecione Incidente [incidente].
      Nota:
      O número de registros por tabela para criação de Corpus de Palavras usado em soluções de Semelhança e Cluster é limitado a 300.000.
      Filtro Selecione os seguintes valores de condição de filtro: [Fechado] [não está vazio] e [Criado nos últimos 6 meses].
      Lista de Campos Para este caso de uso, selecione Descrição resumida, Descriçãoe Anotações de resolução.
      Domínio O sistema exibe automaticamente o grupo de usuários do seu corpus. Por exemplo, neste caso de uso, ele mostra o grupo de usuários global. Você também pode selecionar outros grupos de usuários.
    8. Clique em Enviar.
    9. Na seção Detalhes do corpus de palavras, clique em Novo.
    10. Configure esses campos de acordo com a orientação abaixo para definir um segundo componente de conteúdo para seu corpus de palavras.
      Campo Descrição
      Nome Insira um título que faça referência aos dados que você deseja comparar com o primeiro componente de conteúdo, como Artigos da base de conhecimento publicados.
      Tabela Selecione a tabela que contém os dados que você deseja comparar com o primeiro componente de conteúdo. Para este caso de uso, selecione Conhecimento [kb_knowledge].
      Nota:
      O número de registros por tabela para criação de corpus de palavras usado em soluções de Semelhança e Clustering é limitado a 300.000 registros por tabela.
      Filtro Selecione os seguintes valores de condição do filtro: [Workflow] [is] [Published].
      Lista de Campos Selecione Descrição resumida e Corpo do artigo.
    11. Clique em Enviar.

      Os componentes de conteúdo do corpus de duas palavras aparecem no formulário do corpus de palavras.

      Esta imagem mostra os dois componentes de conteúdo que você criou para o corpus de palavras.
    12. Clique em Atualizar.

    Resultado

    O corpus de palavras concluído que você criou aparece no formulário de corpus de palavras.

    Quando você clica em Atualizar, o sistema valida a adição dos componentes para concluir o processo de criação do corpus.