クラスタリングソリューションの HDBSCAN の構成

  • リリースバージョン: Yokohama
  • 更新日 2025年02月10日
  • 所要時間:3分
  • クラスタリング ソリューションには、Hierarchical Density Based Spatial Clustering of Applications with Noise (HDBSCAN) アルゴリズムを適用することを検討してください。HDBSCAN は、既定のクラスタリング アルゴリズムである k 平均法の代替として使用できます。

    始める前に

    注:
    ML ソリューションの詳細設定の構成はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にしているテクノロジーについて十分な情報を得ていること、およびテクノロジーが提供するものからユースケースが恩恵を受けていることを確認してください。詳細については、ServiceNow コミュニティ の「クラスタリングの詳細パラメーターで詳しく調べる」の記事を参照してください。
    • クラスタリングソリューション定義を作成するか、既存の定義を使用します。
    • 必要なロール:admin または ml_admin

    このタスクについて

    HDBSCAN アルゴリズムを適用して、どのクラスターにも割り当てられていないデータ サンプルをシステムで識別できるようにすることができます。たとえば、HDBSCAN を適用してトピックディスカバリーをサポートできます。

    予測インテリジェンス クラスタリングフレームワークにデフォルトで K-Means アルゴリズムを実装します。HDBSCAN は、最小サイズのクラスターで動作し、より安定した永続的なクラスターを提供するのに役立つ点を除いて、DBSCAN クラスタリング アルゴリズムに似ています。HDBSCAN の仕組みの概要については、 こちらの記事を参照してください。DBSCAN と HDBSCAN の比較については、 この記事この記事を参照してください。

    注:
    HDBSCAN でトレーニングされたクラスタリングソリューションは、クラスターの更新をサポートしていません。これらのソリューションの更新は失敗し、ソリューションはml_cluster_detail_tableに記録されません。クラスターの更新を有効にする場合は、DBSCAN または k-means トレーニング方法を使用します。

    手順

    1. 次のように移動する。 All (すべて) > 予測インテリジェンス > クラスタリング > ソリューション定義.
      新しいクラスターリングソリューション定義を作成する [クラスタリング定義] リストビューへの予測インテリジェンスナビゲーションパス。
    2. [New (新規)] を選択します。
    3. 新しいクラスターリングソリューション定義フォームを作成するか、既存のクラスターリングソリューション定義フォームを使用します。
      この例のシナリオでは、次の図のように hdbscan-sf クラスタリング定義フォームを作成します。フィールドを次のように構成します。
      • ラベル: hdbscan-sf
      • ワードコーパス: incident_wc、またはインシデントレコードデータを含むその他のワードコーパス ( Washington DC リリース以降、ワードコーパスは必要ないため、このフィールドは表示されません)。
      • テーブル:インシデント [incident]
      • フィールド:簡単な説明
      • 更新頻度:更新しない
      • ストップワード:デフォルトの英語のストップワード
      • トレーニング頻度:30 日ごと
      • 処理言語:英語
      DBSCAN パラメーターを適用する、作成するクラスタリングソリューション定義の例。
    4. [送信してトレーニング] を選択します。
    5. トレーニング済みフォームの 関連リンク セクションの Advanced Solution Settings タブで、ピッカーから ソリューション パラメーター を選択し、 新規 を選択します。
      パラメーターを作成するための [ソリューション パラメーター] オプションを選択する方法。
    6. パラメーターレコードを作成します。
      1. [ソリューションパラメーター] フィールドで、検索アイコンをクリックします。
      2. [ML Solution Parameters] 画面で、[ Use HDBSCAN algo for clustering] を選択します。
        [検索] ボタンを選択し、HDBSCAN キーの [簡単な説明] を選択して、パラメーター レコードを作成する方法。
    7. [Submit (送信)] を選択します。
      HDBSCAN アルゴリズムが適用された [Advanced Solution Setting] レコードが表示されます。[ユーザー入力] フィールドは、このアルゴリズムに適用されないため、グレー表示されます。
      割り当てた値から作成した新しいソリューションパラメーターレコード。
    8. [Submit (送信)] を選択します。
      結果:HDBSCAN がクラスタリングソリューション用に構成されました。そのソリューション パラメーターは、クラスターリング ソリューション定義フォームの [高度なソリューション設定] タブに表示されます。
      作成したレコードを送信すると、HDBSCAN ソリューションパラメーターがクラスターリングソリューション定義フォームに表示されます。