Now LLM para perguntas e respostas
Este documento descreve as mudanças no Now LLM para perguntas e respostas por versão.
Março de 2024
- Modelo de perguntas e respostas aprimorado, alternando do modelo baseado em Nemo para um Now LLM baseado em Mistral.
- Melhoria de >2X na latência média e >3X de melhoria na latência do 90º percentil.
- Melhoria relativa de aproximadamente 25% nas métricas de qualidade do modelo (precisão, completude, concisão e formatação).
- Número reduzido de GPUs necessárias por modelo de 2 para 1.
Fevereiro de 2024
Nenhuma atualização.