《經濟通通訊社21日專訊》DeepSeek今日在微信公眾號發文,宣布正式發布
DeepSeek-V3﹒1,並特別提到V3﹒1大模型使用了UE8M0 FP8
Scale的參數精度。DeepSeek隨後在該文章置頂留言稱,UE8M0 FP8是針
對即將發布的下一代國產芯片設計。
據Deepseek介紹,此次升級主要有以下變化,混合推理架構:一個模型同時支持思
考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,
DeepSeek-V3﹒1-Think能在更短時間內給出答案;更強的Agent能力:
通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。
(sl)
送禮活動浪接浪!想緊貼著數活動消息?即Like etnet Facebook專頁!► 立即讚好