NLU 語彙
NLU語彙アイテムを使用して、ユーザーが要求を表現するさまざまな方法をシステムが認識できるようにします。語彙ソースを使用すると、テーブルやリスト内のオブジェクト (会議室の名前やカタログアイテムなど) をシステムが認識しやすくなります。
語彙の使用とコンテキスト
語彙は、ユーザーから遭遇する可能性のあるさまざまな単語やフレーズでモデルに役立ちます。人間はコンピューターではないので、同じことを言うためのさまざまな方法を思いつくかもしれません。たとえば、1 人のユーザーが完全なフレーズではなく頭字語を入力した場合、システムは発言のコンテキストを使用して正しいインテントを予測できる可能性があります。ただし、語彙アイテムを使用して頭字語を定義することで、モデルの信頼性レベルとインテントを正しく予測する機能が向上します。
語彙アイテムは、発言に現れる可能性のあるさまざまな単語やフレーズをカバーします。語彙アイテムは、インテント予測のために指定した同義語にマップされます。これにより、ユーザーが要求を表現するさまざまな方法をシステムが認識すると同時に、予測の一貫性、信頼性、および正確性が確保されます。
語彙アイテムタイプ
| タイプ | 定義 |
|---|---|
| レギュラー | ビジネスや業界固有の用語や頭字語など、あまり知られていない単語やフレーズ。通常の語彙では大文字と小文字が区別されないため、すべての大文字と小文字のバリエーションは作成した語彙によってキャプチャされます。 「通常の語彙アイテムを作成」を参照してください。 |
| パターン | メールアドレスや電話番号などの特定の形式をキャプチャできる正規表現 (regex)。 「パターン語彙アイテムの作成」を参照してください。 |
語彙ソース
- モデルが使用する単一の同義語に簡単にマップできる、個々の単語、フレーズ、またはパターンの語彙アイテムを使用します。
- 語彙ソースを使用して ServiceNow テーブルまたはリストを参照し、定義した単一の同義語で値をすべて置き換えられるようにします。語彙ソースは、すべての NLU モデルで再利用できます。
ユーザーの発言がセット内のオブジェクトを参照する場合は、語彙ソースを使用します。ソースは、 ServiceNow テーブルの値のリスト、または定義した静的リスト (カタログアイテムのリストや会議室など) から参照できます。これらのソースを作成して保存したら、@ 記号を使用してトレーニング発言で指定できます。これらのソースをエンティティ値として使用することもできます。
たとえば、オフィスのすべての会議室のリストが既にあるとします。インテントのトレーニング発言に各会議室名を入力するのではなく、そのリストを参照する語彙ソースを作成できます。
語彙ソースを作成するには、「 テーブル語彙ソースの作成 と リスト語彙ソースの作成」を参照してください。
インテントに関連する語彙の使用
| 発言 | 問題とソリューション |
|---|---|
| 「sfcrm にアクセスする必要があります」 |
|
| 「Word をインストールする必要があります」 |
|
最良の結果を得るには、単一の単語または短いフレーズを同義語として使用します。複数の語彙アイテムを 1 つの同義語にマップできます。1 つの語彙アイテムを複数の同義語にマップしないでください。
詳細なコンテキストと例については、「 NLU インテントを作成」を参照してください。
パターン語彙アイテムの正規表現の例
語彙アイテムを使用して頭字語 IT を識別し、それを同義語 information technology にマッピングするとします。
通常の語彙アイテムは、デフォルトでは大文字と小文字が区別されません。これは、通常の語彙アイテムが頭字語 IT と一般的な単語 it の両方に一致することを意味します。そこで、パターン語彙アイテムを使用することにしました。
使用できる正規表現パターンは \bIT\b です。\b は単語境界マーカーです。これにより、たとえば、 パターンが ITSM や JIT と一致しなくなります。パターン語彙アイテムのデフォルトの大文字と小文字の区別は、 \bIT\b が一般的な単語 it と一致しないことを意味します。
正規表現の詳細: (?i) を使用して、パターンの大文字と小文字の区別をオフにすることができます。このモードは、 (?-i) のようにマイナス記号を使用して終了できます。たとえば、 (?i)te(?-i)st は test と TEst の両方に一致する必要がありますが、 teST または TEST には一致しません。
詳細については、「エンティティでの正規表現の使用」を参照してください。