01/09/2025 09:32
美團開源大模型「龍貓」,部分性能超越DeepSeek
美團(03690)開源大模型「龍貓」(LongCat-Flash),這是一個擁有5600億參數的混合專家(MoE)模型,據介紹,在各項基準測試中它與業界的DeepSeek V3.1、Qwen3旗鼓相當,甚至在某些特定能力上實現了超越。
該模型創新性地採用「零計算」專家機制(Zero-computation Experts) ,能夠極大地節省算力,在處理每個詞元(token)時,僅需動態激活186億至313億的參數(平均約270億)。此外,模型的推理速度超過100詞元/秒(TPS),每處理一百萬輸出詞元的成本僅為0.7美元,並且支持128k的長文本上下文。
目前,LongCat-Flash模型已經發布在Hugging Face和Githiub社區,並遵循MIT許可協議。
《經濟通通訊社1日專訊》
該模型創新性地採用「零計算」專家機制(Zero-computation Experts) ,能夠極大地節省算力,在處理每個詞元(token)時,僅需動態激活186億至313億的參數(平均約270億)。此外,模型的推理速度超過100詞元/秒(TPS),每處理一百萬輸出詞元的成本僅為0.7美元,並且支持128k的長文本上下文。
目前,LongCat-Flash模型已經發布在Hugging Face和Githiub社區,並遵循MIT許可協議。
《經濟通通訊社1日專訊》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
-
上一篇
《窩輪豪情-梁業豪》明天收市前好友大戶須重奪市場控制權 01/09/2025 09:50
-
下一篇
《異動股》百度等5家中概上午9:30異動 01/09/2025 09:31
-
恒指半日升442點報25520,成交逾兩千億,阿里巴巴抽升… 01/09/2025 12:20
-
《娥姐錦囊-張賽娥》美團次季業績遠遜預期,外賣平台「價格戰… 01/09/2025 11:00
-
《異動股》美團跌3%失守紅底,稱開源大模型龍貓部分性能超D… 01/09/2025 09:56
-
《大手成交》美團等5家公司上午9:00市前大手交易 01/09/2025 09:01
-
【大行炒D乜】阿里獲多行升目標最牛見183元,野村削比亞迪… 01/09/2025 08:50
備註︰
即時報價更新時間為 11/09/2025 17:59
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站