LLM トピックテスト

  • リリースバージョン: Washingtondc
  • 更新日 2024年02月01日
  • 読む8読むのに数分
  • チャットウィンドウで、大規模言語モデル (LLM) 仮想エージェントデザイナー を使用するトピックをプレビュー、テスト、デバッグします。

    作業中にチャットテストウィンドウで会話を実行することで、トピックの機能をテストできます。Web (サービスポータル) チャットクライアントはデフォルトのテストウィンドウです。

    大規模言語モデル (LLM) トピックは、(NLU) トピックに比べて自然言語理解 (NLU)高速で簡単にテストできます。たとえば、発言を更新し、トピックと同様に NLU モデルを再トレーニングした後に、トピックを再テストする必要はありません。

    仮想エージェントとサードパーティのメッセージングアプリとの統合を使用している場合、会話の要素がサードパーティのメッセージングアプリケーションでは異なって表示されることがあります。仮想エージェントを展開する予定のサードパーティアプリケーションで会話をテストします。

    注:
    Now Assistパネル、 またはSlackアプリケーションが環境に合わせて構成されている場合、Microsoft Teamsそれらのチャネルのプレビューオプションがテストボタンリストに表示されます。リストから [ Now Assist パネルでプレビュー ]、[Microsoft Teams でプレビュー]、または [Slack でプレビュー ] を選択して、その環境でトピックをテストします。

    チャットテストウィンドウでの LLM トピックのテスト

    図 : 1. LLM テストオプション
    LLM テストオプションは、 仮想エージェントデザイナー キャンバスと [トピック] ページにあります。
    トピックヘッダーバーの [Now Assist でテスト] または [プレビュー] パネルオプションを選択し、キャンバス上の 仮想エージェントデザイナー LLM トピックをテストします。
    注:
    トピックに必要な情報が不足している場合は、フロー図ペインの隅に「未完了」バッジが表示されます。黄色または赤色の警告バッジも各ノードの横に表示されます。未完了バッジには問題の合計数がリストされ、ローカル警告バッジには各ノードで見つかった問題の数が表示されます。[問題があるときに テスト ] を選択すると、[問題] ウィンドウが開き、存在する問題の数と各問題の詳細が表示されます。これらの詳細には、未完了の各アイテムの詳しい説明とハイパーリンクが含まれています。

    または、[トピック] ページでアクティブな (公開済みの) LLM トピックをテストすることもできます。LLM アシスタント フィルターを使用して、アシスタントに関連付けられたトピックのみにトピックを制限し、[アクティブなトピックのテスト] を選択します。LLM アシスタントフィルターを使用しない場合は、[LLM トピックのテスト] を選択します [ アクティブなトピックのテスト ] ドロップダウンメニューから、LLM アシスタントに関連付けられたトピックをテストします。LLM アシスタントの詳細については、「」を参照してください LLM アシスタント

    Web クライアントでチャットテストウィンドウが開き、隣接するタブが表示されます。これらのタブには、テスト時にトピックに関する詳細情報が表示されます。LLM トピックをテストするときは、次のタブを使用できます。

    • テストフレーズの分析 - 入力に基づくトピック検出の結果。
    • プロンプト検出:LLM に送信されるトピック内のすべてのプロンプトのリスト。
    • 変数 - 入力や ライブエージェント 変数など、会話で使用されるすべての変数のリスト。
    • 変数の編集 - このトピックで使用される変数を編集するためのオプション。
    • [コンテキスト] - トピックが実行されるコンテキストを (コンテキスト変数を使用して) 指定するためのオプション。
    • ログ: 実行された処理のリスト。
    図 : 2. LLM テストチャットテストウィンドウとテストタブの例
    テストしている LLM トピックのタイプに基づいて、表示されるタブが異なります。
    キャンバスで関連するトピックタイプをテストすると、 仮想エージェントデザイナー 次のタブが表示されます。
    • すべての LLM トピックタイプに対して、[ テストフレーズを分析]、[ プロンプト検出]、[ 変数]、および [ログ ] タブが表示されます。
    • トピックブロックとカスタムコントロールの [ 変数の編集 ] タブが表示されます。
    • [トピック検出を含める] を選択すると、トピック、セットアップトピック、または雑談トピックの [コンテキスト] タブが表示されます。

    [トピック] ページからテストを実行する場合、テストウィンドウには、[テストフレーズを分析]、[変数]、[コンテキスト] (デフォルトで利用可能で、[トピック検出を含める] オプションなし)、および [ログ] タブのみが表示されます。

    [テストフレーズを分析] タブ

    LLM 対応トピックをテストすると、入力に基づいてトピック検出の結果が表示されます。テストフレーズを入力すると、入力スキルや出力スキルなど、スキル検出のトピック結果が表示されます。最後のトピック検出出力には、選択したトピックと入力の正確さを説明する評価が含まれます。

    図 : 3. LLM トピックの [テストフレーズを分析] タブの例
    [入力スキル] と [出力スキル] の各カテゴリがある、スキル検出のテストフレーズ結果を示す [テストフレーズを分析] タブ。

    スキル検出入力 スキルは、によって Now LLM検索される LLM トピックです。スキル検出出力スキルには、テストフレーズと一致する可能性が最も高いトピック Now LLM が表示されます。[出力スキル] バーには、[ 確実]、[不明]、または [ 不明] の [信頼度] の結果が表示されます。[出力スキル] の下で使用されるトピックには、一致するかどうかを示すブール値がパーセンテージスコアとともに表示されます。スキルまたはトピックに応じて、変数と値 (変数 @laptop_make や値 macbookなど) も一覧表示されます。

    出力スキルバーに悪い結果が表示されている場合は、トピックの説明とトピックノードの指示を調整することで、結果を改善できます。

    さらに、[トピック] ページからアクティブな LLM アシスタントトピックをテストすると、セマンティック検索のスキル結果 (入力スキルや出力スキルなど) が表示されます。セマンティック検索は、検索用語の意味とコンテキストを分析し、その情報を使用して類似の意味を持つ結果を見つけます。自然言語を解釈して検索の意図をより正確に反映することで、検索の再想起を改善します。トピック検出テストのためにセマンティック検索が無効になっている場合、それらの結果は表示されません。セマンティック検索の詳細については、次のリンクを参照してください Semantic vector search in AI Search

    [プロンプト検出] タブ

    LLM に送信されるプロンプトがトピックに含まれている場合は、トピックとノードの 2 つのカテゴリに表示されます。トピックカテゴリには、トピック自体の名前と説明が保持されます。ノードカテゴリには、キャンバス上の LLM 対応ユーザー入力ノード、そのフィールド名とタイプ、およびその内容が一覧表示されます。

    トピックの説明とプロンプトの内容を変更して、会話に最適なプロンプトを作成できます。各プロンプトのステータスは、 元のプロンプトから始まります。プロンプトの内容を変更すると、そのステータスが「 変更されたプロンプト 」に変わり、その横に「元に戻す」アイコン ( [ 元に戻す] アイコンが表示されます。変更されたプロンプトの合計数は、タブの下部の [ トピックに保存 ] ボタンの横に表示されます。変更したプロンプトをテストするには、[ 適用して再起動] を選択します。プロンプトの変更を元に戻すには、プロンプトの横にある元に戻すアイコンを選択します。または、プロンプトを変更したときにアクティブになる [ 元に戻す ] を選択して、すべての変更を元に戻すこともできます。
    注:
    「トピックに 保存」を選択すると、すべての変更が保存され、 すべての変更済み プロンプト・メッセージが 元のプロンプトにリセットされます。
    図 : 4. [プロンプト検出] タブの例
    [トピック] と [ノード] のカテゴリを表示する [プロンプト検出] タブ。
    図 : 5. 変更を含む [プロンプト検出] タブの例
    [変更されたプロンプト] および [トピックに保存] の更新を含む [プロンプト検出] タブ。変更を加えると、[元に戻す]、[適用]、および [再起動] オプションが有効になります。

    [変数] タブ

    [変数] タブには、追跡できるように、会話で使用されるすべての変数のリストと、会話の進行中にキャプチャされる関連する値が表示されます。会話には次の変数タイプを設定できます。
    • 入力変数
    • スクリプト変数
    • ライブエージェント の変数
    • 呼び出し元トピックとトピックブロック間で渡される変数
    リストは、変数タイプによってセクションに分けられます。次の例は、[入力変数] セクションを示しています。静的リストコントロールでは、選択した選択肢の表示ラベルと値の両方がキャプチャされることに注意してください。
    図 : 6. 入力変数のリストの例
    会話フローのスクリーンキャプチャの横にある、入力変数と値が表示されている [変数] タブ。

    次の例は、グループ化されたリスト コントロールの [入力変数] セクションを示しています。この変数情報は静的リストコントロールに似ていますが、変数はグループ化された選択肢の各グループで区切られています。

    図 : 7. グループ化された選択肢変数のリストの例
    グループで区切られた [変数] タブ。ノードとグループ名がハイライト表示されています。

    [変数の編集] タブ

    トピック、トピックブロック、および雑談トピックをテストするときに、トピックのノードにある変数を編集できます。

    トピックのノードで変数を編集します。

    [コンテキスト] タブ

    [ コンテキスト] タブは、トピック、セットアップトピック、または雑談トピックをテストして、チャットに別のコンテキストを指定するときに表示されます。リストからコンテキスト変数を選択します。変数には、トピックのインテントを決定したり、チャットをライブエージェントにルーティングする方法を制御するために使用できるコンテキスト情報が含まれています。たとえば、変数のリストから portal を選択し、ポータル名 IT Express を入力できます。テストケースの作成中は [コンテキスト] タブを使用できません。

    コンテキスト変数の定義の詳細については、「 チャット関連情報を保存するためのコンテキスト変数を設定」を参照してください。仮想エージェントに含まれるライブエージェント変数の詳細については、「ライブエージェントチャットのコンテキスト変数」を参照してください。

    図 : 8. [コンテキスト] タブの例
    サービスポータルのコンテキストポータル値を含む [コンテキスト] タブ。

    次のステップ

    トピックのテストが終了したら、テストチャットウィンドウを閉じます。必要に応じて、テスト情報を使用してトピックを調整し、より正確に実行できるようにします。たとえば、[ テスト フレーズの分析] タブの結果では、低いスコアや、信頼度が 不明 または 不明 の信頼度レーティングが返される場合があります。LLM 対応ユーザー入力ノードのトピックの説明または手順を更新して、スコアを向上させます。