Now LLM para perguntas e respostas

  • Versão de lançamento: Washingtondc
  • Atualizado 6 de mar. de 2024
  • 1 min. de leitura
  • Este documento descreve as mudanças no Now LLM para perguntas e respostas por versão.

    Março de 2024

    • Modelo de perguntas e respostas aprimorado, alternando do modelo baseado em Nemo para um Now LLM baseado em Mistral.
    • Melhoria de >2X na latência média e >3X de melhoria na latência do 90º percentil.
    • Melhoria relativa de aproximadamente 25% nas métricas de qualidade do modelo (precisão, completude, concisão e formatação).
    • Número reduzido de GPUs necessárias por modelo de 2 para 1.

    Fevereiro de 2024

    Nenhuma atualização.