由DeepSeek團隊共同完成、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,登上了國際權威期刊《自然(Nature)》的封面。
論文首次公開了僅靠強化學習,就能激發大模型推理能力的重要研究成果。與今年1月發布的DeepSeek-R1的初版論文相比,本次論文披露了更多模型訓練的細節,並正面回應了模型發布之初的蒸餾質疑。
DeepSeek-R1也是全球首個經過同行評審的主流大語言模型。《自然》在社論中評價:目前幾乎所有主流的大模型都還沒有經過獨立同行評審,這一空白「終於被DeepSeek打破」。
《經濟通通訊社18日專訊》
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇