《經濟通通訊社21日專訊》DeepSeek今日在微信公眾號發文,宣布正式發布
DeepSeek-V3﹒1,並特別提到V3﹒1大模型使用了UE8M0 FP8
Scale的參數精度。DeepSeek隨後在該文章置頂留言稱,UE8M0 FP8是針
對即將發布的下一代國產芯片設計。
據Deepseek介紹,此次升級主要有以下變化,混合推理架構:一個模型同時支持思
考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,
DeepSeek-V3﹒1-Think能在更短時間內給出答案;更強的Agent能力:
通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。
(sl)
【說說心理話】陳敏兒:人生有很多苦痛的經歷,但我不甘心去白受這些苦,要從中「獲利」,去學習,令苦變得有價值,再跟其他人分享► 即睇