NLU 語彙

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:4分
  • NLU語彙アイテムを使用して、ユーザーが要求を表現するさまざまな方法をシステムが認識できるようにします。語彙ソースを使用すると、会議室の名前やカタログアイテムなど、テーブルまたはリスト内のオブジェクトがシステムで認識できるようになります。

    この画像は、リンクされた分子のプラッターを提供するロボットを示しています。ロボットとその他すべてが6つの異なる言語で「NLU語彙」と言っています。

    語彙の用法とコンテキスト

    語彙は、ユーザーが遭遇する可能性のあるさまざまな単語やフレーズをモデルが処理するのに役立ちます。人間はコンピュータではないので、同じことを言うために異なる方法を思いつくかもしれません。たとえば、1 人のユーザーがフレーズ全体ではなく頭字語を入力した場合、システムは発言のコンテキストを使用して正しいインテントを予測できる可能性があります。ただし、語彙アイテムで頭字語を定義することで、インテントを正しく予測するためのモデルの信頼性レベルと機能が向上します。

    [モデルのビルドとトレーニング] フェーズで [語彙] タブが強調表示されています。

    語彙アイテムには、発言に現れる可能性のあるさまざまな単語やフレーズが含まれます。語彙アイテムは、インテント予測のために、指定した同義語にマッピングされます。これにより、システムはユーザーが要求を表現するさまざまな方法を認識すると同時に、予測の一貫性、信頼性、および正確性を確保できます。

    語彙アイテムタイプ

    NLU には、語彙アイテムの作成と設定に使用できる次の語彙タイプが用意されています。
    タイプ 定義
    正規

    ビジネスまたは業界固有の用語や頭字語など、一般的に知られていない単語またはフレーズ。通常の語彙では大文字と小文字が区別されないため、すべての大文字と小文字のバリエーションは、作成した語彙によってキャプチャされます。

    通常の語彙アイテムの作成」を参照してください。

    パターン

    メールアドレスや電話番号などの特定の形式をキャプチャできる正規表現 (regex)。

    パターン語彙アイテムの作成」を参照してください。

    語彙ソース

    語彙ソースを使用して、ユーザーが要求する可能性のあるさまざまなオブジェクトをカバーすることもできます。語彙項目と語彙ソースは、その使用法が異なります。
    • モデルが使用する単一の同義語に簡単にマッピングできる個々の単語、フレーズ、またはパターンの語彙アイテムを使用します。
    • 語彙ソースを使用して ServiceNow テーブルまたはリストを参照し、すべての値を定義した単一の同義語で置き換えることができます。語彙ソースは、すべての NLU モデルで再利用できます。

    ユーザーの発言がセット内のオブジェクトを参照する場合は、語彙ソースを使用します。ソースは、 ServiceNow テーブルの値のリスト、またはカタログアイテムのリストや会議室のリストなど、定義した静的リストから参照できます。これらのソースを作成して保存したら、@ 記号を使用してトレーニング発言で指定できます。これらのソースをエンティティ値として使用することもできます。

    たとえば、オフィスのすべての会議室のリストが既にあるとします。インテントのトレーニング発話に各会議室名を入力する代わりに、そのリストを参照する語彙ソースを作成できます。

    語彙ソースを作成するには、「 テーブル語彙ソースの作成 」と「 リスト語彙ソースの作成」を参照してください。

    インテントに関連する語彙の使用

    インテントが発話の例の語彙とやり取りする方法の例を次に示します。
    注:
    NLU 語彙では、同義語が発話に表示される語彙に置き換わります。
    表 : 1. 目的:OrderSoftware
    発言 問題および解決策
    「sfcrm にアクセスする必要があります」
    • 問題:システムが頭字語 SFCRM を認識しないため、インテントを正確に予測できません。
    • 解決策: sfcrm を通常の語彙アイテムとして追加し、 CRM ソフトウェアなどの同義語を指定します。
    「Word をインストールする必要があります」
    • 問題: この用語 は非常に一般的であり、必ずしもソフトウェア製品を示すものではありません。インストールという用語は有用なコンテキストを提供する可能性がありますが、信頼スコアが低すぎて OrderSoftware インテントを予測できない場合があります。
    • 解決方法 : 大文字の Word の正規表現を使用してパターン語彙アイテムを作成し、システムがソフトウェア製品として認識できるようにします。この追加の制約により、 OrderSoftware インテントが予測される可能性が高くなります。
      注:
      仮想エージェントの会話トピックで使用する特定のソフトウェア名を抽出するには、発言のエンティティとして注釈を付けます。

    最良の結果を得るには、単一の単語または短いフレーズを同義語として使用します。複数の語彙アイテムを 1 つの同義語にマッピングできます。1 つの語彙アイテムを複数の同義語にマッピングしないでください。

    詳細なコンテキストと例については、「 NLU インテントの作成」を参照してください。

    パターン語彙アイテムの正規表現の例

    語彙アイテムを使用して頭字語 IT を識別し、それを同義語 の情報技術にマッピングするとします。

    通常の語彙アイテムでは、デフォルトで大文字と小文字が区別されません。これは、通常の語彙項目が頭字語 IT と一般的な単語 it の両方と一致することを意味します。そこで、パターン語彙アイテムを使用することにしました。

    使用できる正規表現パターンは \bIT\b です。\b は単語境界マーカーです。これにより、パターンが ITSM または JIT などと一致しなくなります。パターン語彙アイテムのデフォルトの大文字と小文字の区別は、 \bIT\b が一般語 it と一致しないことを意味します。

    正規表現の詳細: (?i) を使用して、パターンの大文字と小文字の区別をオフにすることができます。(?-i) のようにマイナス記号を使用して、そのモードを終了できます。たとえば、 (?i)te(?-i)sttestTEst の両方に一致する必要がありますが、 teST または TEST には一致しません。

    詳細については、「エンティティでの正規表現の使用」を参照してください。