クラスタリングソリューションを作成してトレーニングする
類似したレコードをクラスターにグループ化して、まとめて対処したり、パターンを特定したりすることができます。
始める前に
必要なロール:ml_admin または admin
重要:
オーストラリア リリースでは、分類、クラスタリング、および類似性フレームワークのモデルはワークフローソリューションを使用します。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、それらはワークフローソリューションになり、[ワードコーパス] フィールドはフォームから削除されます。
このタスクについて
この手順例では、最近発生した類似のインシデントをグループ化して重大なインシデントを特定するソリューションを作成します。
暗号化されたトレーニングデータの使用については、「 予測インテリジェンスにおけるデータの暗号化」を参照してください。
手順
タスクの結果
ソリューションがトレーニングされ、トレーニングが完了するとリアルタイムで通知されます。
ツリーマッププロットが [クラスターリングソリューション定義] フォームの [クラスターの表示方法] タブに表示されます。プロットには、システムがソリューションに対して形成したクラスターが左上隅から右下隅に降順で示されます。ツリーマップノードラベルはクラスターの概念であり、クラスターの上位の単語によって作成され、各クラスターで最も目立つコンテンツを確認するのに役立ちます。
注:
クラスターの概念には、処理された入力データの上位の単語がデータの言語で表示されます。言語によっては、クラスターの概念に語根形式で単語が表示され、切り捨てて表示される場合があります。
各ノードは、そのノードのクラスター品質に応じて赤から緑の色になります。[グループの選択] フィルターは、クラスタリング定義フォームで [ グループを使用] フィールドと [ グループ] フィールドを選択した場合にのみ表示されます。クラスターをポイントすると、その Groupby 値、クラスター数、および Groupby 内のレコードが表示されます。 図 : 1. クラスターの可視化の例
クラスターを開くには、クラスターをクリックするか、[すべてのグループを表示] フィルターから選択します。
クラスターのグループ化内で、クラスターサイズとクラスター品質の 2 つのスライドバーを使用して、結果をさらにフィルタリングできます。[戻る] ボタンをクリックして戻ることもできます。このボタンは、クラスタリング階層が存在する場合にのみ表示されます。このレベルのクラスターをポイントすると、[純度] フィールドのパーセンタイル値が [クラスターの概念]、[品質]、および [サイズ] の値とともに表示されます。図 : 2. クラスターグループの例
クラスターノードをクリックすると、その ML クラスターの詳細がリストビュー形式で表示されます。図 : 3. [クラスターの詳細] ページ
次のタスク
ソリューションの [ソリューション統計情報] タブでソリューション出力を確認します。クラスタリングソリューションの結果に満足できない場合は、ソリューションに設定した値を再構成し、満足のいく結果が得られるまで再トレーニングします。
- クラスター ID、品質サイズ、および Groupby 値のリストビューについては、[クラスターサマリー] タブを確認してください。
図 : 4. クラスターサマリーの例 - [クラスター更新] タブで、ソリューション定義で構成した各クラスター更新間隔のクラスターへの変更の概要を確認します。
図 : 5. クラスター更新の例