マルチモデルバッチテストの実行

オーストラリア AI を有効にする

Release

australia

ft:locale

ja-JP

ft:publication_title

オーストラリア AI を有効にする

ft:clusterId

platai

bundleId

platai

workflow

Platform

マルチモデルバッチテストの実行

リリースバージョン: Australia

更新日 2026年03月12日

所要時間：2分

複数の自然言語理解 (NLU) (NLU) モデルをテストセットに対してテストします。モデルの品質を評価し、インテント予測を改善するためにモデルを改善します。

NLU ワークベンチ - Core プラグイン、NLU ワークベンチプラグイン、NLU ワークベンチ - Advanced Features プラグイン、および予測インテリジェンスプラグインがすべてインストールされ、アクティブ化されていることを確認します。
仮想エージェントまたは AI 検索に対してトレーニング済みモデルを 1 つ以上用意します。
想定されるインテントを持つテスト発言を含むテストセットを用意します。「テストセットの作成」または「テストセットの作成と管理」を参照してください。
必要なロール:nlu_admin または admin モデルにアサインされると、nlu_editor ロールはそのモデルのテストを実行し、テスト発言を変更できます。

マルチモデルバッチテストでは、モデルのデフォルトテストセットではないテストセットを使用できます。

また、マルチモデルバッチテストを使用して、一度に最大 10 個のモデルをテストできます。ただし、モデル数が少ないテストの方が速く実行されます。

複数のモデルをテストする場合、テストセットはすべてのモデルの合計インテントの少なくとも 25% をカバーする必要があります。モデルが仮想エージェントまたは AI 検索で遭遇する可能性がある発言を含むテストセットを使用します。

注:

テストセット内の想定されるインテントがモデルのどのインテントとも一致しない場合、その想定されるインテントとそのテスト発言はスキップされます。それらはカウントされず、テスト結果には表示されません。

デフォルトのテストセットに対して単一のモデルをテストするには、モデルの概要ページでモデルのテストと公開フェーズを使用します。詳細については、「モデルをテストおよび公開」を参照してください。

バッチテストが終了すると、[ステータス] が [完了] に変わります。テストセットの名前をクリックすると、テスト結果を表示できます。

その結果を使用して、モデルを調整し、改善します。次に、テストを再度実行してパフォーマンスを評価します。

バッチテストは、信頼性しきい値の推奨事項に影響を与える可能性があります。詳細については、「NLU モデル設定」を参照してください。