ワードコーパスの作成
テキストの類似性に基づいてインスタンスレコードを比較するために使用する語彙として機能する単語とフレーズのコレクションをビルドします。ワードコーパスは、機械学習システムに理解させたい辞書と考えることができます。
始める前に
重要:
Yokohamaリリースでは、分類、クラスタリング、および類似性フレームワークのモデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。
アップグレード後、ワードコーパスを含む既存のソリューションは、次回の再トレーニング時にワークフローソリューションになります。また、[ワードコーパス] フィールドがフォームから削除されます。
従来のコンテキスト用に次の情報が提供されています。
このタスクについて
ワードコーパスの主な目的は、 NLU モデルをトレーニングするためのテキストデータを推測することです。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズでのトレーニング用に指定する必要があります。トレーニング済みのワードコーパスは、ソリューションと機能全体で再利用できます。
ワードコーパスを使用すると、テーブル内または複数のテーブル間で類似するレコードテキストを比較できます。ワードコーパスは、データ分析、再利用、またはレビューのために類似のレコードをグループ化するクラスタリングなどの他のシナリオでも役立ちます。コーパスに追加するアイテムは、他の類似性ソリューションやクラスタリングソリューションで再利用したり、さまざまなユースケースに適用したりできるように、会社や業界に固有のものにする必要があります。
この手順例では、インシデントレコードを操作しており、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を探す必要があります。ここでの目標は、アクティブなインシデントを公開済みの KB 記事と比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。