Executar um teste em lote de vários modelos
Teste vários modelos Compreensão da linguagem natural (NLU) em um conjunto de testes. Avalie a qualidade dos seus modelos e refine-os para melhorar a previsão de intenção.
Antes de Iniciar
- Certifique-se de que o plug-in Workbench de NLU - Core, o plug-in Workbench de NLU, o plug-in Workbench de NLU - Recursos avançados e o plug-in Inteligência preditiva estejam todos instalados e ativados.
- Tem um ou mais modelos treinados para Virtual Agent ou Pesquisa com IA.
- Tenha um conjunto de testes contendo enunciados de teste com as intenções esperadas. Consulte Criar um conjunto de testes ou Criação e gestão de conjunto de testes.
- Função necessária: nlu_admin ou admin. Quando atribuída a um modelo, a função nlu_editor pode executar testes e modificar enunciados de teste para esse modelo.
Por Que e Quando Desempenhar Esta Tarefa
No teste em lote para vários modelos, você pode usar um conjunto de testes que não seja o conjunto de testes padrão do modelo.
Além disso, você pode testar até dez modelos de uma vez usando o Teste em lote de vários modelos. No entanto, os testes com menos modelos são executados mais rapidamente.
Ao testar vários modelos, seu conjunto de testes deve cobrir pelo menos 25% do total de intenções de todos os modelos. Use conjuntos de testes que contenham enunciados que os modelos provavelmente encontrarão em Virtual Agent ou Pesquisa com IA.
Para testar um único modelo em relação ao conjunto de testes padrão, use a fase Testar e publicar seu modelo na página de visão geral do modelo. Para obter mais informações, consulte Teste e publique seu modelo.
Procedimento
O que Fazer Depois
Quando o teste em lote é concluído, seu Status muda para Concluído. Você pode clicar no nome do conjunto de testes para exibir os resultados do teste.
Use os resultados para ajustar e melhorar seus modelos. Em seguida, execute o teste novamente para avaliar o desempenho.
O teste em lote pode afetar as recomendações de limite de confiança. Para obter mais informações, consulte Configurações do modelo de NLU.