Configurer HDBSCAN pour une solution de mise en grappe

  • Rversion finale: Xanadu
  • Mis à jour 1 août 2024
  • 2 minutes de lecture
  • Envisagez d’appliquer l’encodage HDBSCAN (Hierarchical Density Based Spatial Clustering of Applications with Noise) à votre solution de clustering. K-means est l’algorithme de clustering par défaut.

    Avant de commencer

    Remarque :
    La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre. Pour plus d'informations, consultez https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847.
    • Créez une définition de solution de mise en grappe ou utilisez une définition existante.
    • Rôle requis : admin ou ml_admin

    Pourquoi et quand exécuter cette tâche

    Vous pouvez appliquer l’algorithme HDBSCAN pour aider le système à identifier les échantillons de données qui ne sont affectés à aucune grappe. Par exemple, vous pouvez appliquer HDBSCAN pour prendre en charge la découverte de rubriques.

    Predictive Intelligence utilise l’algorithme k-means par défaut dans son cadre de travail de clustering. HSBSCAN est un autre algorithme de clustering qui est similaire à l’algorithme DBSCAN, sauf qu’il fonctionne avec des clusters de taille minimale et peut aider à fournir des clusters plus stables et persistants. Pour un résumé du fonctionnement de HDBSCAN, consultez cet article. Pour une comparaison entre DBSCAN et HDBSCAN, consultez cet article et cet article.

    Remarque :
    Les solutions de clustering entraînées avec HDBSCAN ne prennent pas en charge les mises à jour de cluster. Les mises à jour de ces solutions échouent et les solutions ne sont pas consignées dans le ml_cluster_detail_table. Utilisez les méthodes d’entraînement DBSCAN ou k-means si vous souhaitez activer les mises à jour de clusters.

    Procédure

    1. Accédez à la Tout > Intelligence prédictive > Mise en grappe > Définitions des solutions.
      Chemin de navigation Intelligence prédictive vers la vue de liste Définitions de mise en grappe dans laquelle vous créez une nouvelle définition de solution de mise en grappe.
    2. Cliquez sur Nouveau.
    3. Créez un formulaire de définition de solution de mise en grappe ou utilisez un formulaire existant.
      Dans cet exemple de scénario, vous créez le formulaire de définition de mise en grappe hdbscan-sf comme dans l’image ci-dessous. Configurez les champs comme suit :
      • Étiquette : hdbscan-sf
      • Corpus de mots : incident_wc ou tout autre corpus de mots contenant des données d’enregistrement d’incident
      • Table : Incident [incident]
      • Champs : description courte
      • Fréquence de mise à jour : Ne pas mettre à jour
      • Mots vides : mots vides anglais par défaut
      • Fréquence de la formation : Tous les 30 jours
      • Langue de traitement : Anglais
      Un exemple de définition de solution de mise en grappe que vous créez et auquel vous appliquerez le paramètre DBSCAN.
    4. Cliquez sur Soumettre et former.
    5. Dans l’onglet Paramètres de solution avancés de la section Liens connexes du formulaire formé, sélectionnez Paramètres de solution dans le sélecteur, puis cliquez sur Nouveau.
      Comment sélectionner l’option Paramètres de solution pour créer le paramètre.
    6. Créez un enregistrement de paramètre.
      1. Dans le champ Paramètres de la solution , cliquez sur l’icône de recherche.
      2. Dans l’écran Paramètres de la solution ML, sélectionnez Utiliser HDBSCAN pour la mise en grappe.
        Comment créer l’enregistrement de paramètre en sélectionnant le bouton Rechercher, puis en sélectionnant la brève description de la clé HDBSCAN.
    7. Cliquez sur Envoyer.
      L’enregistrement de paramètre de solution avancée s’affiche avec l’algorithme HDBSCAN appliqué à l’enregistrement.
      Le nouvel enregistrement de paramètre de solution que vous créez à partir des valeurs que vous venez d’affecter.
    8. Cliquez sur Envoyer.
      Résultat : HDBSCAN est configuré pour votre solution de clustering. Son paramètre de solution s’affiche dans l’onglet Paramètres de solution avancés de votre formulaire de définition de solution de mise en grappe.
      Lorsque vous soumettez l’enregistrement que vous avez créé, le paramètre de solution HDBSCAN s’affiche sur votre formulaire de définition de solution de mise en grappe.