《經濟通通訊社9日專訊》5月8日,阿里巴巴(09988)(US﹒BABA)開源了
ZeroSearch,這是一種無需與真實搜索引擎交互即可激勵大模型搜索能力的強化學習
框架。它利用大模型預訓練知識轉化為檢索模塊,能動態控制生成內容質量。在多個問答數據集
上,其搜索能力超過谷歌搜索,且成本大幅降低。
研究人員在NQ、TriviaQA、PopQA、HotpotQA等7大問答數據集上
進行了綜合評測。結果顯示,一個70億參數的監督微調模型使用ZeroSearch後,其
搜索能力達到了33﹒06;140億參數的模型則達到了33﹒97,超過了谷歌搜索的
32﹒47。
在成本方面,研究人員通過SerpAPI使用谷歌搜索進行約64000次搜索查詢的訓
練,成本約為586﹒70美元;而在四個A100GPU上使用140億參數的大模型進行模
擬時,成本僅為70﹒80美元,成本降低了80%以上。(ct)
【你點睇?】特朗普宣布向全部海外製作電影徵收100%關稅,指可重振美國電影業,你認為措施能否起到幫助?► 立即投票