《經濟通通訊社21日專訊》DeepSeek今日在微信公眾號發文,宣布正式發布
DeepSeek-V3﹒1,並特別提到V3﹒1大模型使用了UE8M0 FP8
Scale的參數精度。DeepSeek隨後在該文章置頂留言稱,UE8M0 FP8是針
對即將發布的下一代國產芯片設計。
據Deepseek介紹,此次升級主要有以下變化,混合推理架構:一個模型同時支持思
考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,
DeepSeek-V3﹒1-Think能在更短時間內給出答案;更強的Agent能力:
通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。
(sl)
【你點睇?】新田科技城發展區發現明朝古墓群,有團體倡當局修改規劃,原址保留,你是否贊成?► 立即投票