Crie um corpus de palavras

  • Versão de lançamento: Australia
  • Atualizado 12 de mar. de 2026
  • 4 min. de leitura
  • Crie uma coleção de palavras e frases que funcione como o vocabulário que o sistema usa para comparar seus registros de instância com base em sua semelhança textual. Você pode pensar no corpus de palavras como um dicionário que você quer que seu sistema de aprendizado de máquina entenda.

    Antes de Iniciar

    Função necessária: administrador ou ml_admin
    Importante:
    Em Austrália A versão, os modelos nas estruturas de classificação, clustering e semelhança usam soluções de fluxo de trabalho. Eles são pré-treinados, portanto, um corpus de palavras não é necessário para suas novas soluções.

    Após o upgrade, suas soluções existentes com um corpus de palavras se tornarão soluções de fluxo de trabalho na próxima vez que forem retreinados. Além disso, o campo Corpus do Word é removido do formulário.

    As informações a seguir são fornecidas para o contexto legado.

    Por Que e Quando Desempenhar Esta Tarefa

    O principal objetivo de um corpus de palavras é inferir dados textuais para treinar seu NLU modelo. Se estiver usando um corpus de palavras em uma solução, você deve especificá-lo para treinamento na fase de definição de solução de uma solução. Um corpus de palavras treinado pode ser reutilizado em soluções e capacidades.

    Você pode usar um corpus de palavras para ajudar a comparar texto de registro semelhante em uma tabela ou em várias tabelas. Um corpus de palavras também pode ser útil em outros cenários, como clustering, em que você agrupa registros semelhantes para análise de dados, reutilização ou revisão. Os itens que você adiciona ao seu corpus devem ser específicos à sua empresa e ao seu setor para que você possa reutilizá-los em outras soluções de similaridade ou cluster e aplicá-los a vários casos de uso.

    Neste procedimento de exemplo, você está trabalhando em registros de incidentes e deseja localizar artigos relevantes da base de conhecimento (KB) que podem fornecer resoluções para esses casos de incidente. Seu objetivo aqui é criar um corpus de palavras que você possa aplicar a uma nova solução de semelhança que compare incidentes ativos com artigos da base de conhecimento publicados.

    Procedimento

    1. Navegar até Tudo > Inteligência preditiva > Corpus de palavras.
    2. No formulário Corpus do Word, clique em Novo .
    3. Configure esses campos de acordo com a orientação a seguir.
      Campo Descrição
      Nome Um título exclusivo que faz referência ao conteúdo do seu corpus. Por exemplo, neste caso de uso, você pode inserir um nome como Incidentes ativos e KBs publicados , como o nome indica as tabelas que seu corpus minerará para ajudar a criar sua solução.
      Ativo Marque esta caixa de seleção se você estiver criando mais de um corpus de palavras por vez e planeja configurar os componentes detalhados mais tarde. Caso contrário, deixe-o em branco porque você pode selecioná-lo em uma etapa posterior.
    4. Selecione Enviar.
    5. Na exibição de lista Corpus de palavras, localize seu novo corpus de palavras e clique no mesmo Nome valor para abrir o registro.
    6. Na seção Conteúdo do Corpus do Word, clique em Novo .
    7. No formulário Conteúdo do corpus do Word, configure esses campos de acordo com a orientação a seguir para definir um componente de conteúdo para o seu corpus de palavras.
      Campo Descrição
      Nome Insira um título que faça referência aos dados que você deseja adicionar ao seu corpus, como Incidentes encerrados nos últimos 6 meses .
      Tabela Selecione a tabela que contém os dados que você deseja incluir em seu corpus de palavras. Para este caso de uso, selecione Incidente [incidente] .
      Nota:
      O número de registros por tabela para criação de Corpus do Word usados em soluções de Semelhança e Cluster é limitado a 300 000.
      Filtro Selecione os seguintes valores de condição de filtro: [Encerrado] [não está vazio] e [Criado nos últimos 6 meses] .
      Lista de Campos Para este caso de uso, selecione Descrição resumida , Descrição e. Anotações de resolução .
      Domínio O sistema exibe automaticamente o grupo de usuários do seu corpus. Por exemplo, neste caso de uso, ele mostra o grupo de usuários global. Você também pode selecionar outros grupos de usuários.
    8. Selecione Enviar.
    9. Na seção Detalhes do corpus do Word, selecione Novo .
    10. Configure esses campos de acordo com a orientação a seguir para definir um segundo componente de conteúdo para seu corpus de palavras.
      Campo Descrição
      Nome Insira um título que faça referência aos dados que você deseja comparar com seu primeiro componente de conteúdo, como Artigos da base de conhecimento publicados .
      Tabela Selecione a tabela que contém os dados que você deseja comparar com seu primeiro componente de conteúdo. Para este caso de uso, selecione Conhecimento [kb_knowledge] .
      Nota:
      O número de registros por tabela para criação de corpus de palavras usado em soluções de similaridade e cluster é limitado a 300 000 registros por tabela.
      Filtro Selecione os seguintes valores de condição de filtro: [Fluxo de trabalho] [É] [Publicado] .
      Lista de Campos Selecione Descrição resumida e. Corpo do artigo .
    11. Selecione Enviar.

      Os componentes de conteúdo do corpus de duas palavras aparecem no formulário do corpus de palavras.

      Esta imagem mostra os dois componentes de conteúdo que você criou para o seu corpus de palavras.
    12. Selecione Atualizar.

    Resultado

    O corpus de palavras concluído que você criou aparece no formulário de corpus de palavras e está disponível para uso em seus formulários de definição de solução de similaridade e clustering.

    Quando você clica em Atualizar, o sistema valida a adição dos componentes para concluir o processo de criação do corpus.

    O que Fazer Depois

    Crie uma solução na estrutura apropriada. Para obter mais informações, consulte os links no painel Conteúdo relacionado nesta página.