クラスタリングソリューションの HDBSCAN の構成

  • リリースバージョン: Washingtondc
  • 更新日 2024年02月01日
  • 1 読むのに数分読む
  • クラスタリング ソリューションに Hierarchical Density Based Spatial Clustering of Applications with Noise (HDBSCAN) エンコーディングを適用することを検討してください。K 平均法は既定のクラスタリング アルゴリズムです。

    始める前に

    注:
    ML ソリューションの詳細設定はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にするテクノロジについて十分な情報が得られていること、およびテクノロジが提供する機能からメリットを得るユース ケースがあることを確認してください。
    • クラスタリングソリューション定義を作成するか、既存のものを使用します。
    • 必要なロール:admin または ml_admin

    このタスクについて

    HDBSCAN アルゴリズムを適用すると、どのクラスターにも割り当てられていないデータサンプルをシステムが識別できるようになります。たとえば、HDBSCAN を適用してトピック検出をサポートできます。

    予測インテリジェンスは、クラスタリングフレームワークでデフォルトで k-means アルゴリズムを使用します。HSBSCAN は、DBSCAN アルゴリズムに似た別のクラスタリング アルゴリズムですが、最小サイズのクラスタで機能し、より安定した永続的なクラスタを提供するのに役立ちます。HDBSCAN のしくみの概要については、 こちらの記事を参照してください。DBSCAN と HDBSCAN の比較については、 こちらの記事こちらの記事を参照してください。

    注:
    HDBSCAN でトレーニングされたクラスタリング ソリューションは、クラスタの更新をサポートしていません。これらのソリューションの更新は失敗し、ソリューションはml_cluster_detail_tableに記録されません。クラスターの更新を有効にする場合は、DBSCAN または k-means 学習方法を使用します。

    手順

    1. 移動先 すべて > 予測インテリジェンス > クラスタリング > ソリューション定義.
      新しいクラスタリングソリューション定義を作成する [クラスタリング定義] リストビューへの Predictive Intelligence ナビゲーションパス。
    2. [New (新規)] をクリックします。
    3. 新しいクラスターリングソリューション定義フォームを作成するか、既存のフォームを使用します。
      このシナリオ例では、下の画像のように hdbscan-sf クラスタリング定義フォームを作成します。フィールドを次のように構成します。
      • ラベル: hdbscan-sf
      • ワードコーパス: incident_wc、またはインシデントレコードデータを含むその他のワードコーパス
      • テーブル:インシデント [incident]
      • フィールド:簡単な説明
      • 更新頻度:更新しない
      • ストップワード:デフォルトの英語のストップワード
      • トレーニング頻度:30日ごと
      • 処理言語:英語
      DBSCAN パラメーターを適用する、作成するクラスタリングソリューション定義の例。
    4. [ Submit & Train] をクリックします。
    5. トレーニング済みフォームの [関連リンク] セクションにある [ソリューションの詳細設定] タブで、ピッカーから [ソリューションパラメーター ] を選択し、[ 新規] をクリックします。
      パラメーターを作成するための [ソリューションパラメーター] オプションを選択する方法。
    6. パラメーターレコードを作成します。
      1. [ソリューションパラメーター] フィールドで、検索アイコンをクリックします。
      2. [ML Solution Parameters] 画面で、[ Use HDBSCAN for clustering] を選択します。
        [検索] ボタンを選択し、HDBSCAN キーの [簡単な説明] を選択して、パラメーター レコードを作成する方法。
    7. [Submit (送信)] をクリックします。
      HDBSCAN アルゴリズムが適用された詳細ソリューション設定レコードが表示されます。
      アサインした値から作成する新しいソリューションパラメーターレコード。
    8. [Submit (送信)] をクリックします。
      結果: HDBSCAN はクラスタリング ソリューション用に構成されます。そのソリューションパラメーターは、クラスタリングソリューション定義フォームの [ソリューションの詳細設定] タブに表示されます。
      作成したレコードを送信すると、クラスタリングソリューション定義フォームに HDBSCAN ソリューションパラメーターが表示されます。