《經濟通通訊社30日專訊》小米大模型「Xiaomi MiMo」微信公眾號今日發文
宣布,小米今日開源首個為推理(Reasoning)而生的大模型「Xiaomi
MiMo」,聯動預訓練到後訓練,全面提升推理能力。
據介紹,MiMo來自全新成立不久的「小米大模型Core團隊」的初步嘗試。在數學推
理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上
,MiMo僅用7B的參數規模就超越了OpenAI的閉源推理模型o1-mini和阿里
Qwen更大規模的開源推理模型QwQ-32B-Preview。
隨著DeepSeek-R1引發業界強化學習(RL)共創潮,DeepSeek-R1
-Distill-7B和Qwen2﹒5-32B已成為廣泛使用的強化學習起步模型。在相
同RL訓練數據情況下,MiMo-7B的數學及代碼領域的強化學習潛力顯著領先。(sl)
想延緩老化、保持年輕?堅持每日3件事:魚油+維他命D+運動=「慢老」!現凡購買 維柏健【3倍精煉魚油】,即享68折$239.3 (原價$352),更享+$78換購維柏健【健骨維他命D3】(原價$138)!(優惠期至15/7/2025)► 了解詳情