ワードコーパスの作成

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:4分
  • テキストの類似性に基づいてインスタンスレコードを比較するために使用する語彙として機能する単語とフレーズのコレクションをビルドします。ワードコーパスは、機械学習システムに理解させたい辞書と考えることができます。

    始める前に

    必要なロール:admin または ml_admin
    重要:
    Yokohamaリリースでは、分類、クラスタリング、および類似性フレームワークのモデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。

    アップグレード後、ワードコーパスを含む既存のソリューションは、次回の再トレーニング時にワークフローソリューションになります。また、[ワードコーパス] フィールドがフォームから削除されます。

    従来のコンテキスト用に次の情報が提供されています。

    このタスクについて

    ワードコーパスの主な目的は、 NLU モデルをトレーニングするためのテキストデータを推測することです。ソリューションでワードコーパスを使用する場合は、ソリューションのソリューション定義フェーズでのトレーニング用に指定する必要があります。トレーニング済みのワードコーパスは、ソリューションと機能全体で再利用できます。

    ワードコーパスを使用すると、テーブル内または複数のテーブル間で類似するレコードテキストを比較できます。ワードコーパスは、データ分析、再利用、またはレビューのために類似のレコードをグループ化するクラスタリングなどの他のシナリオでも役立ちます。コーパスに追加するアイテムは、他の類似性ソリューションやクラスタリングソリューションで再利用したり、さまざまなユースケースに適用したりできるように、会社や業界に固有のものにする必要があります。

    この手順例では、インシデントレコードを操作しており、それらのインシデントケースの解決策を提供できる関連するナレッジベース (KB) 記事を探す必要があります。ここでの目標は、アクティブなインシデントを公開済みの KB 記事と比較する新しい類似性ソリューションに適用できるワードコーパスを作成することです。

    手順

    1. 次のように移動する。 All (すべて) > 予測インテリジェンス > ワードコーパス.
    2. [ワードコーパス] フォームで、[ 新規] をクリックします。
    3. 次のガイダンスに従って、これらのフィールドを設定します。
      フィールド 説明
      [Name (名前)] コーパスの内容を参照する一意のタイトル。たとえば、このユースケースでは、「 アクティブなインシデント」や「公開された KB」などの名前を入力できます。名前は、ソリューションの作成に役立つコーパスがマイニングするテーブルを示すためです。
      [Active (アクティブ)] 一度に複数のワードコーパスを作成し、それらの詳細コンポーネントを後で構成する場合は、このチェックボックスをオンにします。それ以外の場合は、後のステップで選択できるため空白のままにします。
    4. [Submit (送信)] を選択します。
    5. [ワードコーパス] リストビューで、新しいワードコーパスを見つけ、その 名前 の値をクリックしてレコードを開きます。
    6. [ワードコーパスコンテンツ] セクションで、[ 新規作成] をクリックします。
    7. [ワードコーパスコンテンツ] フォームで、次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスのコンテンツコンポーネントを定義します。
      フィールド 説明
      [Name (名前)] コーパスに追加するデータを参照するタイトル ( 「過去 6 か月間にクローズされたインシデント」など) を入力します。
      テーブル ワードコーパスに含めるデータを含むテーブルを選択します。このユースケースでは、 インシデント [incident] を選択します。
      注:
      類似性ソリューションおよびクラスターリングソリューションで使用されるワードコーパス作成のテーブルあたりのレコード数は 30 万件に制限されています。
      フィルター フィルター条件値として 、[クローズ済み]、[空でない]、および [過去 6 か月間に作成] を選択します。
      フィールドリスト このユースケースでは、[ 簡単な説明]、[ 説明]、および [解決メモ] を選択します。
      ドメイン コーパスのユーザーグループが自動的に表示されます。たとえば、このユースケースでは、グローバルユーザーグループが表示されています。他のユーザーグループも選択できます。
    8. [Submit (送信)] を選択します。
    9. ワードコーパスの詳細 セクションで、 新規 を選択します。
    10. 次のガイダンスに従ってこれらのフィールドを設定し、ワードコーパスの 2 番目のコンテンツコンポーネントを定義します。
      フィールド 説明
      [Name (名前)] 公開された KB 記事など、最初のコンテンツコンポーネントと比較するデータを参照するタイトルを入力します。
      テーブル 最初のコンテンツコンポーネントと比較するデータを含むテーブルを選択します。このユースケースでは、 ナレッジ [kb_knowledge] を選択します。
      注:
      類似性ソリューションおよびクラスタリングソリューションで使用されるワードコーパス作成のテーブルあたりのレコード数は、テーブルあたり 300,000 レコードに制限されています。
      フィルター フィルター条件値として 、[ワークフロー] [次の値に等しい] [公開済み] を選択します。
      フィールドリスト [簡単な説明] と [記事本文] を選択します。
    11. [Submit (送信)] を選択します。

      2 つのワードコーパスコンテンツコンポーネントがワードコーパスフォームに表示されます。

      この画像は、ワードコーパス用に作成した 2 つのコンテンツコンポーネントを示しています。
    12. [Update (更新)] を選択します。

    タスクの結果

    作成した完成したワードコーパスがワードコーパスフォームに表示され、類似性ソリューション定義フォームおよびクラスターリングソリューション定義フォームで使用できます。

    [更新] をクリックすると、コンポーネントの追加が検証され、コーパスの作成プロセスが完了します。

    次のタスク

    適切なフレームワークでソリューションを作成します。詳細については、このページの [関連コンテンツ] パネルのリンクを参照してください。