ワードコーパスの作成

Yokohama AI を有効にする

Release

yokohama

ft:locale

ja-JP

ft:publication_title

Yokohama AI を有効にする

ft:clusterId

platai

bundleId

platai

workflow

Platform

ワードコーパスの作成

リリースバージョン: Yokohama

更新日 2025年01月30日

所要時間：4分

テキストの類似性に基づいてインスタンスレコードを比較するために使用する語彙として機能する単語とフレーズのコレクションをビルドします。ワードコーパスは、機械学習システムに理解させたい辞書と考えることができます。

始める前に

必要なロール：admin または ml_admin

重要:

Yokohamaリリースでは、分類、クラスタリング、および類似性フレームワークのモデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。

アップグレード後、ワードコーパスを含む既存のソリューションは、次回の再トレーニング時にワークフローソリューションになります。また、[ワードコーパス] フィールドがフォームから削除されます。

従来のコンテキスト用に次の情報が提供されています。

このタスクについて

ワードコーパスの主な目的は、 NLU モデルをトレーニングするためのテキストデータを推測することです。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズでのトレーニング用に指定する必要があります。トレーニング済みのワードコーパスは、ソリューションと機能全体で再利用できます。

ワードコーパスを使用すると、テーブル内または複数のテーブル間で類似するレコードテキストを比較できます。ワードコーパスは、データ分析、再利用、またはレビューのために類似のレコードをグループ化するクラスタリングなどの他のシナリオでも役立ちます。コーパスに追加するアイテムは、他の類似性ソリューションやクラスタリングソリューションで再利用したり、さまざまなユースケースに適用したりできるように、会社や業界に固有のものにする必要があります。

この手順例では、インシデントレコードを操作しており、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を探す必要があります。ここでの目標は、アクティブなインシデントを公開済みの KB 記事と比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。

手順

次のように移動する。 All (すべて) > 予測インテリジェンス > ワードコーパス.
[ワードコーパス] フォームで、[ 新規] をクリックします。

次のガイダンスに従って、これらのフィールドを設定します。


フィールド	説明
[Name (名前)]	コーパスの内容を参照する一意のタイトル。たとえば、このユースケースでは、「 `アクティブなインシデント」や「公開された KB`」などの名前を入力できます。名前は、ソリューションの作成に役立つコーパスがマイニングするテーブルを示すためです。
[Active (アクティブ)]	一度に複数のワードコーパスを作成し、それらの詳細コンポーネントを後で構成する場合は、このチェックボックスをオンにします。それ以外の場合は、後のステップで選択できるため空白のままにします。

[Submit (送信)] を選択します。
[ワードコーパス] リストビューで、新しいワードコーパスを見つけ、その名前の値をクリックしてレコードを開きます。
[ワードコーパスコンテンツ] セクションで、[ 新規作成] をクリックします。

[ワードコーパスコンテンツ] フォームで、次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスのコンテンツコンポーネントを定義します。


フィールド	説明
[Name (名前)]	コーパスに追加するデータを参照するタイトル ( `「過去 6 か月間にクローズされたインシデント`」など) を入力します。
テーブル	ワードコーパスに含めるデータを含むテーブルを選択します。このユースケースでは、インシデント [incident] を選択します。注: 類似性ソリューションおよびクラスターリングソリューションで使用されるワードコーパス作成のテーブルあたりのレコード数は 30 万件に制限されています。
フィルター	フィルター条件値として、[クローズ済み]、[空でない]、および [過去 6 か月間に作成] を選択します。
フィールドリスト	このユースケースでは、[ 簡単な説明]、[ 説明]、および [解決メモ] を選択します。
ドメイン	コーパスのユーザーグループが自動的に表示されます。たとえば、このユースケースでは、グローバルユーザーグループが表示されています。他のユーザーグループも選択できます。

[Submit (送信)] を選択します。
ワードコーパスの詳細セクションで、新規を選択します。

次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスの 2 番目のコンテンツコンポーネントを定義します。


フィールド	説明
[Name (名前)]	`公開された KB 記事`など、最初のコンテンツコンポーネントと比較するデータを参照するタイトルを入力します。
テーブル	最初のコンテンツコンポーネントと比較するデータを含むテーブルを選択します。このユースケースでは、ナレッジ [kb_knowledge] を選択します。注: 類似性ソリューションおよびクラスタリングソリューションで使用されるワードコーパス作成のテーブルあたりのレコード数は、テーブルあたり 300,000 レコードに制限されています。
フィルター	フィルター条件値として、[ワークフロー] [次の値に等しい] [公開済み] を選択します。
フィールドリスト	[簡単な説明] と [記事本文] を選択します。

[Submit (送信)] を選択します。

2 つのワードコーパスコンテンツコンポーネントがワードコーパスフォームに表示されます。
[Update (更新)] を選択します。

タスクの結果

作成した完成したワードコーパスがワードコーパスフォームに表示され、類似性ソリューション定義フォームおよびクラスターリングソリューション定義フォームで使用できます。

[更新] をクリックすると、コンポーネントの追加が検証され、コーパスの作成プロセスが完了します。

次のタスク

適切なフレームワークでソリューションを作成します。詳細については、このページの [関連コンテンツ] パネルのリンクを参照してください。