04/08/2025 11:00
小米(01810)發布及開源聲音理解大模型
《經濟通通訊社4日專訊》小米(01810)在微信公告中稱,周一發布,並全量開源MiDashengLM-7B模型,模型基於Xiaomi Dasheng作為音頻編碼器,以及Qwen2﹒5-Omni-7B Thinker作為自回歸解碼器,通過創新的通用音頻描述訓練策略,實現了對語音、環境聲音和音樂的統一理解。 公告稱,音頻理解是小米「人車家全生態」戰略的核心技術組件,在智能座艙、家居交互等場景廣泛落地應用。(rh)
【說說心理話】陳敏兒經歷丈夫突然病逝,成立「幸福生活協會」,幫助照顧者。舉辦按摩工作坊,讓癌末病人都有幸福的感覺► 即睇