NLU 語彙
語彙アイテムを使用すると NLU 、ユーザーが要求を表現するさまざまな方法をシステムが認識できるようになります。語彙ソースを使用すると、会議室やカタログアイテムの名前など、システムがテーブルまたはリスト内のオブジェクトを認識できるようになります。
語彙の使用法とコンテキスト
語彙は、ユーザーから出される可能性のあるさまざまな単語やフレーズでモデルが役立ちます。人間はコンピューターではないので、同じことを言うのにさまざまな言い方を思いつくかもしれません。たとえば、1 人のユーザーが完全なフレーズではなく頭字語を入力した場合、システムは発言のコンテキストを使用して正しいインテントを予測できる場合があります。ただし、語彙項目で頭字語を定義することで、インテントを正しく予測するためのモデルの信頼性レベルと機能が向上します。
語彙アイテムは、発言に表示される可能性のあるさまざまな単語やフレーズをカバーします。語彙アイテムは、インテント予測のために、指定した同義語にマップされます。これにより、ユーザーが要求を表現するさまざまな方法をシステムが認識すると同時に、予測の一貫性、信頼性、および精度を確保できます。
語彙アイテムタイプ
| タイプ | 定義 |
|---|---|
| 正規 | ビジネスまたは業界固有の用語や頭字語など、一般に知られていない単語またはフレーズ。通常の語彙は大文字と小文字を区別しないため、すべての大文字と小文字のバリエーションは、作成した語彙によってキャプチャされます。 「通常の語彙アイテムを作成する」を参照してください。 |
| パターン | メールアドレスや電話番号などの特定の形式をキャプチャできる正規表現。 「パターン語彙アイテムの作成」を参照してください。 |
語彙ソース
- モデルが使用する単一の同義語に簡単にマッピングできる個々の単語、フレーズ、またはパターンの語彙アイテムを使用します。
- 語彙ソースを使用してテーブルまたはリストを参照 ServiceNow し、すべての値を定義した単一の同義語に置き換えられるようにします。語彙ソースは、すべての NLU モデルで再利用できます。
語彙ソースは、ユーザーの発言がセット内のオブジェクトを参照する場合に使用します。ソースは、テーブルの値 ServiceNow のリストから参照することも、カタログアイテムのリストや会議室のリストなど、ユーザーが定義した静的リストから参照することもできます。これらのソースを作成して保存したら、@ 記号を使用してトレーニング発言で指定できます。これらのソースをエンティティ値として使用することもできます。
たとえば、オフィスのすべての会議室のリストが既にあるとします。語彙ソースを作成して、インテントのトレーニング発言に各会議室名を入力する代わりに、そのリストを参照できます。
語彙ソースを作成するには、「」およびリスト語彙ソースの作成「」テーブル語彙ソースの作成を参照してください。
インテントに関連する語彙の使用
| 発言 | 問題と解決策 |
|---|---|
| 「sfcrm にアクセスする必要があります」 |
|
| 「Word をインストールする必要があります」 |
|
最良の結果を得るには、単一の単語または短いフレーズを同義語として使用します。複数の語彙アイテムを 1 つの同義語にマップできます。1 つの語彙アイテムを複数の同義語にマップしないでください。
その他のコンテキストと例については、次を参照してください NLU インテントの作成。
パターン語彙項目の正規表現の例
語彙項目を使用して頭字語 IT を識別し、それを同義語の Information Technology にマップするとします。
通常の語彙項目では、デフォルトで大文字と小文字が区別されません。つまり、通常の語彙項目は、頭字語 IT と一般的な単語 it の両方に一致します。そこで、パターン語彙項目を使用することにします。
使用できる正規表現パターンは \bIT\b です。\b は単語境界マーカーです。これにより、パターンが ITSM や JIT などと一致しなくなります。パターン語彙項目のデフォルトの大文字と小文字の区別は、 \bIT\b が一般的な単語 it と一致しないことを意味します。
正規表現の詳細: (?i) を使用して、パターン内の大文字と小文字の区別をオフにできます。このモードは、 (?-i) のようにマイナス記号を使用して終了できます。たとえば、 (?i)te(?-i)st は test と TEst の両方に一致する必要がありますが、 teST や TEST には一致しません。
詳細については、「エンティティでの正規表現の使用」を参照してください。