拒絕馬斯克百萬美元高薪邀約 

清大學霸開發腦啟發AI打敗OpenAI
02/12/2025
1826
收藏
分享
清大學霸開發腦啟發AI打敗OpenAI

在北京清華大學腦科學實驗室裡,兩名年僅22歲的年輕創業者——William Chen與Guan Wang——做出一個令外界意外的決定:拒絕來自馬斯克(Elon Musk)旗下xAI提供的數百萬美元高薪邀約,選擇繼續投入一項風險更高、目標更遠的人工智能(AI)研究路線,試圖開發能邁向人工通用智能(AGI)的全新推理系統。

兩人高中相識,兩年前在校期間共同開發小型語言模型OpenChat。與主流大模型仰賴海量網路資料不同,OpenChat只使用一小部分精挑細選的高品質對話文本進行訓練,並藉由強化學習(RL)機制不斷自我優化。這種「精緻小模型」策略意外獲得學界關注,也讓兩位創業者聲名大噪,並吸引馬斯克親自抛出橄欖枝。

但在評估大型語言模型的發展瓶頸後,兩人認為單純堆疊參數與數據的路線難以突破推理極限,決定追求更具顛覆性的方向。他們創立新公司Sapient Intelligence,聚集來自Google DeepMind、DeepSeek、Anthropic、xAI等AI企業,以及劍橋大學、北京大學、清華大學、亞伯達大學等學術機構的科研與工程人員,開始研發一套以「人腦啟發」為基礎的新型推理模型。

層次推理模型

其核心成果為「層次推理模型(Hierarchical Reasoning Model, HRM)」。該架構模仿人類大腦在「深思熟慮」與「快速反應」之間的協同工作方式,使模型不再只依賴統計預測,而能進行多步規劃、邏輯拆解與內部推理。令人矚目的是,HRM首個原型僅擁有2,700萬個參數,卻在多項抽象推理任務測試中表現超越OpenAI、Anthropic及DeepSeek的主流模型,顯示小模型結合推理結構設計,或許能突破傳統變壓器模型的效率天花板。

陳表示,HRM在抑制AI「幻覺」問題方面遠優於傳統大型語言模型,並在時間序列預測與邏輯分析測試上達到當前最先進水準。相較參數規模往往動輒數千億,HRM的高效性被視為AI模型發展的重要新方向。

事實上,William Chen的科技興趣可追溯至美國密西根州布盧姆菲爾德山的童年時期,他自小熱衷拆解電子產品,培養出對機械與程式的濃厚興趣。進入清大後,與Guan Wang在腦認知與腦啟發智慧實驗室的合作,最終將學術研究轉化為創業計畫。

目前,Sapient Intelligence已籌備於美國設立辦公室,並計畫展開第二代模型研發與新一輪融資。陳預測,AGI大規模問世的時間點「可能在未來十年內」,並坦言即使不是由他們率先實現,這一目標也終將成真。

兩名年輕創業者選擇拒絕科技巨頭的高薪邀請,轉而投身高風險、長周期的前沿研究,為AI產業投下一顆耐人尋味的變數。這場以人腦推理為靈感、試圖改寫AI發展路徑的實驗,或將為下一代智慧機器揭開新的可能性。 (編輯部)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報