Configure o HDBSCAN para uma solução de cluster

  • Versão de lançamento: Yokohama
  • Atualizado 10 de fev. de 2025
  • 2 min. de leitura
  • Considere aplicar o algoritmo de Cluster espacial de aplicações com ruído baseado em densidade hierárquica (HDBSCAN) à sua solução de cluster. HDBSCAN está disponível como uma alternativa ao algoritmo de clustering padrão, k-means.

    Antes de Iniciar

    Nota:
    A definição de configurações avançadas em suas soluções DE ML é opcional. Se você optar por definir qualquer uma dessas configurações, certifique-se de estar bem informado sobre a tecnologia que está habilitando na solução e de que seu caso de uso se beneficie do que a tecnologia oferece. Para obter mais informações, consulte Mergulhe mais fundo com os parâmetros avançados de cluster artigo em Comunidade ServiceNow.
    • Crie uma definição de solução de cluster ou use uma existente.
    • Função necessária: admin ou ml_admin

    Por Que e Quando Desempenhar Esta Tarefa

    Você pode aplicar o algoritmo HDBSCAN para ajudar o sistema a identificar amostras de dados que não estão atribuídas a nenhum cluster. Por exemplo, você pode aplicar HDBSCAN para oferecer suporte à Descoberta de tópicos.

    Inteligência preditivaimplementa o. k-means algoritmo por padrão em sua estrutura de cluster. HDBSCAN é semelhante ao algoritmo de clustering DBSCAN, exceto que ele funciona com clusters de tamanho mínimo e pode ajudar a entregar clusters mais estáveis e persistentes. Para obter um resumo de como o HDBSCAN funciona, consulte este artigo . Para obter uma comparação entre DBSCAN e HDBSCAN, consulte este artigo e. este artigo .

    Nota:
    As soluções de cluster treinadas com HDBSCAN não são compatíveis com atualizações de cluster. As atualizações nessas soluções falham e as soluções não são registradas em ML_CLUSTER_DETAIL_TABLE. Use os métodos de treinamento DBSCAN ou k-means se quiser habilitar atualizações de cluster.

    Procedimento

    1. Navegar até Tudo > Inteligência preditiva > Clustering > Definições de solução.
      O caminho de navegação da Inteligência preditiva para a exibição da lista Definições de cluster, na qual você cria uma nova definição de solução de cluster.
    2. Selecione Novo.
    3. Crie um novo formulário de definição de solução de cluster ou use um existente.
      Neste cenário de exemplo, você cria o. hdbscan-sf forma de definição de cluster como na imagem abaixo. Configure os campos da seguinte forma:
      • Rótulo : hdbscan-sf
      • Word Corpus : incident_wc , ou qualquer outro corpus de palavras que tenha dados de registro de incidente (do Washington DCum corpus de palavras não é necessário, portanto este campo não aparece).
      • Tabela: Incidente [incidente]
      • Campos : Descrição resumida
      • Frequência de atualização : Não atualizar
      • Palavras de interrupção : Palavras padrão em inglês
      • Frequência de treinamento : A cada 30 dias
      • Idioma de processamento : Inglês
      Um exemplo de definição de solução de cluster que você cria na qual aplicará o parâmetro DBSCAN.
    4. Selecione Enviar e treinar .
    5. Na guia Configurações avançadas da solução na seção Links relacionados do formulário treinado, selecione Parâmetros da solução no seletor e selecione Novo .
      Como selecionar a opção Parâmetros da solução para criar o parâmetro.
    6. Crie um registro de parâmetro.
      1. Em Parâmetros da solução , clique no ícone de pesquisa.
      2. Na tela Parâmetros da solução de ML, selecione Use o algoritmo HDBSCAN para clustering .
        Como criar o registro de parâmetro selecionando o botão Pesquisar e, em seguida, selecionando a Descrição resumida da chave HDBSCAN.
    7. Selecione Enviar.
      O registro de Configuração de solução avançada aparece com o algoritmo HDBSCAN aplicado ao registro. O campo Entradas do usuário está acinzentado porque não se aplica a este algoritmo.
      O novo registro de parâmetro de solução que você cria a partir dos valores que acabou de atribuir.
    8. Selecione Enviar.
      Resultado HDBSCAN está configurado para sua solução de cluster. O parâmetro de solução aparece na guia Configurações avançadas da solução do formulário de definição da solução de cluster.
      Quando você envia o registro que você criou, o parâmetro de solução HDBSCAN aparece no formulário de definição da solução de cluster.