據《量子位》發表的文章表示,ACL 2025的頒獎典禮上,由DeepSeek梁文鋒作為通訊作者、與北京大學等聯合發表的論文榮獲最佳論文獎。他們提出的原生稀疏注意力(NSA)機制,通過算法與硬件的協同優化,直接把長文本處理速度提升了11倍。更厲害的是,性能不僅沒降反而還超越了傳統的全注意力模型。這項技術可能會成為 DeepSeek-V4和DeepSeek-R2的核心。
《經濟通通訊社31日專訊》
【說說心理話】照顧者壓力大 情緒出現問題應找心理醫生!嘉賓:「雖然很貴,但是值得的,他救了我一命!」► 即睇