中國科學院自動化研究所周一宣布,李國齊、徐波團隊在原創「內生複雜性」理論基礎上,聯合沐曦MetaX推出我國首個類腦脈衝大模型「瞬悉1.0」(SpikingBrain-1.0),並在國產GPU集群平台上完成全流程訓練與推理,標誌國內自主可控的非Transformer新型大模型架構生態取得突破。
研究團隊已開源SpikingBrain-1.0-7B模型,並開放SpikingBrain-1.0-76B測試網址。該模型在多項核心指標上實現創新:其一,依靠線性或近線性計算架構,僅以主流大模型2%的數據量,即可在MMLU、CMMLU等多任務理解測試中達到可比性能;其二,推理效率提升顯著,在百萬至四百萬Token超長序列下,生成首個Token速度比傳統架構快26至100倍,手機CPU端推理速度亦成倍提升;其三,適配國產GPU高效框架與算子庫,展示國產自主可控大模型的可行性;其四,採用動態閾值脈衝化與MoE混合專家機制,在7B模型上實現逾69%稀疏度,顯著降低能耗。
中科院表示,這一成果首次構建出大規模類腦線性基礎模型,為法律醫學文檔分析、基因序列研究等超長序列任務提供新路徑,並為低功耗神經形態計算和未來AI芯片設計提供理論與技術支撐。(編輯部)