Now LLM Q&A 向け
このドキュメントでは、 Now LLM リリース別の Q&A の変更点について説明します。
2024 年 3 月
- NemoベースのモデルからMistralベースのNow LLMに切り替えることで、Q&Aモデルを改善しました。
- 平均レイテンシーが >2 倍、90 パーセンタイルレイテンシーが > 3 倍改善されました。
- モデルの品質指標(精度、完全性、簡潔さ、フォーマット)の相対的な改善が~25%向上しました。
- モデルごとに必要な GPU の数を 2 から 1 に減らしました。
2024 年 2 月
更新はありません。