ワードコーパスの作成

  • リリースバージョン: Australia
  • 更新日 2026年03月12日
  • 所要時間:4分
  • テキストの類似性に基づいてインスタンスレコードを比較するためにシステムが使用する語彙として機能する単語とフレーズのコレクションを構築します。ワードコーパスは、機械学習システムに理解してもらいたい辞書と考えることができます。

    始める前に

    必要なロール:admin または ml_admin
    重要:
    オーストラリア リリースでは、分類、クラスタリング、および類似性フレームワークのモデルはワークフローソリューションを使用します。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。

    アップグレード後、ワードコーパスを含む既存のソリューションは、次回の再トレーニング時にワークフローソリューションになります。また、[ワードコーパス] フィールドがフォームから削除されます。

    次の情報は、従来のコンテキスト用に提供されています。

    このタスクについて

    ワードコーパスの主な目的は、 NLU モデルをトレーニングするためのテキストデータを推測することです。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズでのトレーニング用に指定する必要があります。トレーニング済みのワードコーパスは、ソリューションと機能間で再利用できます。

    ワードコーパスを使用すると、テーブル内または複数のテーブル間で類似するレコードテキストを比較できます。ワードコーパスは、データの分析、再利用、またはレビューのために類似したレコードをグループ化するクラスタリングなど、他のシナリオでも役立ちます。コーパスに追加するアイテムは、他の類似性ソリューションやクラスタリングソリューションで再利用してさまざまなユースケースに適用できるように、会社や業界に固有のものである必要があります。

    この手順例では、インシデントレコードを操作していて、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を探します。ここでの目標は、アクティブなインシデントと公開された KB 記事を比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。

    手順

    1. 移動先 すべて > 予測インテリジェンス > ワードコーパス.
    2. ワードコーパスフォームで、[ 新規] をクリックします。
    3. 次のガイダンスに従って、これらのフィールドを構成します。
      フィールド 説明
      名前 コーパスの内容を参照する一意のタイトル。たとえば、このユースケースでは、「 アクティブなインシデント」や「公開された KB」などの名前を入力できます。名前は、ソリューションの作成に役立てるためにコーパスがマイニングするテーブルを示すためです。
      アクティブ 一度に複数のワードコーパスを作成し、詳細コンポーネントを後で構成する場合は、このチェックボックスをオンにします。それ以外の場合は、後のステップで選択できるため、空白のままにします。
    4. [送信] を選択します。
    5. [ワードコーパス] リストビューで、新しいワードコーパスを見つけ、その 名前 の値をクリックしてレコードを開きます。
    6. [ワードコーパスコンテンツ] セクションで、[ 新規] をクリックします。
    7. [ワードコーパスコンテンツ] フォームで、次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスのコンテンツコンポーネントを定義します。
      フィールド 説明
      名前 コーパスに追加するデータを参照するタイトル ( 「過去 6 か月間にクローズされたインシデント」など) を入力します。
      テーブル ワードコーパスに含めるデータを含むテーブルを選択します。このユースケースでは、 インシデント [incident] を選択します。
      注:
      類似性ソリューションおよびクラスタリングソリューションで使用されるワードコーパス作成用のテーブルあたりのレコード数は 300,000 に制限されています。
      フィルター フィルター条件値 [クローズ済み] [は空でない] および [過去 6 か月間に作成] を選択します。
      フィールドリスト このユースケースでは、[ 簡単な説明]、[ 説明]、および [ 解決メモ] を選択します。
      ドメイン コーパスのユーザーグループが自動的に表示されます。たとえば、このユースケースでは、グローバルユーザーグループが表示されます。他のユーザーグループを選択することもできます。
    8. [送信] を選択します。
    9. [ワードコーパスの詳細] セクションで、[ 新規] を選択します。
    10. 次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスの第 2 コンテンツコンポーネントを定義します。
      フィールド 説明
      名前 公開 済みの KB 記事など、最初のコンテンツコンポーネントと比較するデータを参照するタイトルを入力します。
      テーブル 最初のコンテンツコンポーネントと比較するデータを含むテーブルを選択します。このユースケースでは、[ ナレッジ [kb_knowledge] を選択します。
      注:
      類似性およびクラスタリングソリューションで使用されるワードコーパス作成のテーブルあたりのレコード数は、テーブルあたり 300,000 レコードに制限されています。
      フィルター フィルター条件値 [ワークフロー] [次の値に等しい] [公開済み] を選択します。
      フィールドリスト [ 簡単な説明][記事本文] を選択します。
    11. [送信] を選択します。

      2 つのワードコーパスコンテンツコンポーネントがワードコーパスフォームに表示されます。

      この画像は、ワードコーパス用に作成した 2 つのコンテンツコンポーネントを示しています。
    12. [更新] を選択します。

    タスクの結果

    作成した完成したワードコーパスがワードコーパスフォームに表示され、類似性フォームおよびクラスターリングソリューション定義フォームで使用できます。

    [更新] をクリックすると、コンポーネントの追加が検証され、コーパスの作成プロセスが完了します。

    次のタスク

    適切なフレームワークでソリューションを作成します。詳細については、このページの [関連コンテンツ] パネルのリンクを参照してください。