中科院發布首個類腦脈衝大模型

在國產GPU完成訓練推理
09/09/2025
4489
收藏
分享
在國產GPU完成訓練推理

中國科學院自動化研究所周一宣布,李國齊、徐波團隊在原創「內生複雜性」理論基礎上,聯合沐曦MetaX推出我國首個類腦脈衝大模型「瞬悉1.0」(SpikingBrain-1.0),並在國產GPU集群平台上完成全流程訓練與推理,標誌國內自主可控的非Transformer新型大模型架構生態取得突破。

研究團隊已開源SpikingBrain-1.0-7B模型,並開放SpikingBrain-1.0-76B測試網址。該模型在多項核心指標上實現創新:其一,依靠線性或近線性計算架構,僅以主流大模型2%的數據量,即可在MMLU、CMMLU等多任務理解測試中達到可比性能;其二,推理效率提升顯著,在百萬至四百萬Token超長序列下,生成首個Token速度比傳統架構快26至100倍,手機CPU端推理速度亦成倍提升;其三,適配國產GPU高效框架與算子庫,展示國產自主可控大模型的可行性;其四,採用動態閾值脈衝化與MoE混合專家機制,在7B模型上實現逾69%稀疏度,顯著降低能耗。

中科院表示,這一成果首次構建出大規模類腦線性基礎模型,為法律醫學文檔分析、基因序列研究等超長序列任務提供新路徑,並為低功耗神經形態計算和未來AI芯片設計提供理論與技術支撐。(編輯部)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報