《經濟通通訊社20日專訊》8月19日晚間,DeepSeek宣布其線上模型版本已升
級至V3﹒1,新版本的上下文長度拓展至128k,且增強版本已準備好進行測試。
新模型擁有更長的上下文窗口,這意味著DeepSeek能一次性記住和處理更長的文本
內容,對長文檔分析、代碼庫理解、長對話保持一致性都更有幫助。DeepSeek暫未介紹
模型的具體細節做,但已將模型文件上傳至Hugging Face,不過目前僅開源了未經
指令微調的基礎模型,其配置文件、腳本代碼和模型權重均可供下載。(wn)
【你點睇?】美烏元首白宮會談後,特朗普再與普京通電,你認為美國能否促成「普澤會」?你對俄烏實現和平有多大信心?► 立即投票