Considere aplicar o algoritmo HDBSCAN (Hierarchical Density Based Spacial Clustering of Applications with Noise) à sua solução de clustering. O HDBSCAN está disponível como uma alternativa ao algoritmo de clustering padrão, k-means.
Antes de Iniciar
Nota:
Definir configurações avançadas em suas soluções de ML é opcional. Se você optar por definir qualquer uma dessas configurações, certifique-se de estar bem informado sobre a tecnologia que está habilitando na solução e de que seu caso de uso se beneficie do que a tecnologia oferece. Para obter mais informações, consulte o artigo Mergulhe mais fundo com Parâmetros avançados de cluster em Comunidade ServiceNow.
Crie uma definição de solução de clustering ou use uma existente.
Função necessária: admin ou ml_admin
Por Que e Quando Desempenhar Esta Tarefa
Você pode aplicar o algoritmo HDBSCAN para ajudar o sistema a identificar amostras de dados que não estão atribuídas a nenhum cluster. Por exemplo, você pode aplicar HDBSCAN para oferecer suporte à descoberta de tópico.
Inteligência preditiva implementa o algoritmo k-means por padrão em sua estrutura de clustering. O HDBSCAN é semelhante ao algoritmo de cluster DBSCAN, exceto pelo fato de que ele funciona com clusters de tamanho mínimo e pode ajudar a fornecer clusters mais estáveis e persistentes. Para obter um resumo de como o HDBSCAN funciona, consulte este artigo. Para obter uma comparação entre DBSCAN e HDBSCAN, consulte este artigo e este artigo.
Nota:
As soluções de cluster treinadas com HDBSCAN não são compatíveis com atualizações de cluster. As atualizações nessas soluções falham e as soluções não são registradas em ml_cluster_detail_table. Use os métodos de treinamento DBSCAN ou k-means se quiser habilitar atualizações de cluster.
Procedimento
Navegar até Tudo > Inteligência preditiva > Clustering > Definições de solução.
Selecione Novo.
Crie um novo formulário de definição de solução de cluster ou use um existente.
Neste cenário de exemplo, você cria o formulário de definição de cluster hdbscan-sf como na imagem abaixo. Configure os campos da seguinte forma:
Rótulo: hdbscan-sf
Corpus de palavras: incident_wcou qualquer outro corpus de palavras que tenha dados de registro de incidentes (a partir da versão Washington DC, um corpus de palavras não é necessário, portanto, este campo não aparece).
Tabela: Incidente [incidente]
Campos: descrição resumida
Frequência de atualização: Não atualizar
Palavras irrelevantes: palavras irrelevantes padrão em inglês
Frequência de treinamento: a cada 30 dias
Idioma de processamento: inglês
Selecione Enviar e treinar.
Na guia Configurações avançadas de solução na seção Links relacionados do formulário treinado, selecione Parâmetros de solução no seletor e escolha Novo.
Crie um registro de parâmetro.
No campo Parâmetros da solução, clique no ícone de pesquisa.
Na tela Parâmetros da solução de ML, selecione Usar algoritmo HDBSCAN para clustering.
Selecione Enviar.
O registro de configuração de solução avançada aparece com o algoritmo HDBSCAN aplicado ao registro. O campo Entradas do usuário está esmaecido porque não se aplica a este algoritmo.
Selecione Enviar.
Resultado: o HDBSCAN está configurado para sua solução de clustering. Seu parâmetro de solução aparece na guia Configurações avançadas de solução do formulário de definição de solução de cluster.