阿里（９９８８）開源視頻生成模型，降計算消耗增圖像及視頻數據

　　《經濟通通訊社３１日專訊》阿里巴巴（０９９８８）開源視頻生成模型Ｗａｎ２﹒２，採
用混合專家（Ｍｉｘｔｕｒｅ－ｏｆ－Ｅｘｐｅｒｔｓ，　ＭｏＥ）架構，現已於
Ｈｕｇｇｉｎｇ　Ｆａｃｅ、ＧｉｔＨｕｂ及阿里雲開源社區ＭｏｄｅｌＳｃｏｐｅ開放下載。
Ｗａｎ２﹒２系列包含文生視頻模型Ｗａｎ２﹒２－Ｔ２Ｖ－Ａ１４Ｂ、圖生視頻模型
Ｗａｎ２﹒２－Ｉ２Ｖ－Ａ１４Ｂ，以及統一視頻生成模型Ｗａｎ２﹒２－ＴＩ２Ｖ－５Ｂ。
　
　　公司稱，模型可在單一框架內同時處理文生視頻與圖生視頻任務，且基於ＭｏＥ架構並經過
精選美學數據訓練，當中Ｗａｎ２﹒２－Ｔ２Ｖ－Ａ１４Ｂ與Ｗａｎ２﹒２－Ｉ２Ｖ－Ａ１４Ｂ
能夠生成具有電影級品質的視頻，且均採用雙模型設計，配有專注整體場景布局的高噪專家模型
，與負責細節紋理優化的低噪專家模型。兩款模型總參數達２７０億，但每步僅激活１４０億參
數，成功降低５０％計算消耗。
　
　　公司亦稱，相較Ｗａｎ２﹒１，Ｗａｎ２﹒２模型訓練數據量大幅擴充，其中圖像數據增加
６５﹒６％，視頻數據增長８３﹒２％。
　
　　另外，全新推出的混合模型Ｗａｎ２﹒２－ＴＩ２Ｖ－５Ｂ採用高壓縮率３Ｄ　ＶＡＥ架構
，僅需消費級ＧＰＵ即可在數分鐘內生成５秒７２０Ｐ視頻。
　
　　阿里巴巴亦提到，曾於２０２５年２月開源四款Ｗａｎ２﹒１模型，並於同年５月發布
Ｗａｎ２﹒１－ＶＡＣＥ（多合一視頻編輯全功能模型）。截至目前，這些模型在
Ｈｕｇｇｉｎｇ　Ｆａｃｅ與ＭｏｄｅｌＳｃｏｐｅ的總下載量已突破５４０萬次。（ｒｈ）

【香港好去處】2025去邊最好玩？etnet為你提供全港最齊盛事活動，所有資訊盡在掌握！► 即睇

關稅戰

關稅戰 | 加拿大、瑞士遭徵35%至39%重稅，瑞郎小幅下跌

大國博弈

工匠精神＋創新，「中國製造」再升級

貨幣攻略

日本加息牽扯全球資金流向

說說心理話

備註：	即時報價更新時間為01/08/2025 16:06
	港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站