《經濟通通訊社9日專訊》5月8日,阿里巴巴(09988)(US﹒BABA)開源了
ZeroSearch,這是一種無需與真實搜索引擎交互即可激勵大模型搜索能力的強化學習
框架。它利用大模型預訓練知識轉化為檢索模塊,能動態控制生成內容質量。在多個問答數據集
上,其搜索能力超過谷歌搜索,且成本大幅降低。
研究人員在NQ、TriviaQA、PopQA、HotpotQA等7大問答數據集上
進行了綜合評測。結果顯示,一個70億參數的監督微調模型使用ZeroSearch後,其
搜索能力達到了33﹒06;140億參數的模型則達到了33﹒97,超過了谷歌搜索的
32﹒47。
在成本方面,研究人員通過SerpAPI使用谷歌搜索進行約64000次搜索查詢的訓
練,成本約為586﹒70美元;而在四個A100GPU上使用140億參數的大模型進行模
擬時,成本僅為70﹒80美元,成本降低了80%以上。(ct)
《說說心理話》「星二代」有甚麼壓力?姜大衛兒子姜卓文參加《造星》:雖然輸了比賽,但卻得到很多!分享如何學會面對問題及成長► 即睇