《經濟通通訊社21日專訊》DeepSeek今日在微信公眾號發文,宣布正式發布
DeepSeek-V3﹒1,並特別提到V3﹒1大模型使用了UE8M0 FP8
Scale的參數精度。DeepSeek隨後在該文章置頂留言稱,UE8M0 FP8是針
對即將發布的下一代國產芯片設計。
據Deepseek介紹,此次升級主要有以下變化,混合推理架構:一個模型同時支持思
考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,
DeepSeek-V3﹒1-Think能在更短時間內給出答案;更強的Agent能力:
通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。
(sl)
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇