在人形機器人產業加速發展之際,機器人運動控制技術正成為各家企業競逐的重要方向。中國具身智能企業銀河通用(Galbot)周四宣布,推出全球首個面向人形機器人的通用小腦GPT基礎模型AstraBrain-WBC 0.5,並稱該模型是業界首個達到GPT-1量級的人形機器人全身實時運動控制大模型,有望推動機器人從單一動作控制邁向通用運動能力。
銀河通用在官方微信公眾號表示,AstraBrain-WBC 0.5採用GPT風格的因果Transformer(Causal Transformer)架構,參數規模達8,040萬個,並以超過2萬小時的人類動作數據進行訓練,累積訓練資料超過20億幀(frames),是目前公開資訊中規模最大的機器人全身運動控制模型之一。
與目前大多數人形機器人仍依賴針對特定場景設計控制器不同,銀河通用希望透過通用基礎模型方式,讓機器人學習如同人類般的運動規律,進而提升在不同環境中的適應能力。
公司指出,如果把人工智能模型比喻為機器人的「大腦」,負責理解世界、規劃任務與決策,那麼「小腦」則負責將決策轉化為實際動作,在毫秒級時間內協調全身數十個自由度關節運動,包括平衡控制、步態調整、外力干擾補償及精細動作執行等。
銀河通用表示,AstraBrain-WBC 0.5首次將全身運動控制重新定義為連續序列預測問題。透過類似大型語言模型預測下一個詞語的方式,機器人可以根據過去的動作歷史,預測未來的運動狀態與控制策略,從而實現更自然、更流暢的全身運動。
任務成功率大幅提升
值得注意的是,銀河通用同時宣稱首次在人形機器人運動控制領域驗證出類似GPT模型的「Scaling Law(規模定律)」效應。根據公司公布的實驗數據,隨著訓練資料規模從200萬幀增加至20億幀,模型任務成功率由83.26%提升至92.58%,而零樣本(Zero-shot)運動追蹤誤差則持續下降。
這意味著機器人運控模型可能與大型語言模型一樣,能透過持續增加數據量及模型規模來獲得性能提升,而非依賴大量人工規則設計。若該趨勢獲得更多研究驗證,將為未來人形機器人的通用化發展提供新的技術路徑。
近年來,隨著生成式AI技術快速發展,全球科技公司正積極將大模型技術延伸至具身智能(Embodied AI)領域,包括Tesla、Figure AI、Agility Robotics以及多家中國人形機器人企業均投入相關研發,希望建立兼具感知、決策與運動能力的通用機器人平台。
業界普遍認為,相較於語言理解與推理能力的快速突破,人形機器人在現實世界中的運動控制仍是最具挑戰性的技術瓶頸之一。如何讓機器人在複雜地形下保持平衡、完成高精度操作,甚至在未知環境中自主學習與適應,將直接影響其商業化落地速度。
銀河通用表示,未來將持續擴大訓練數據規模及模型能力,進一步提升機器人在行走、抓取及全身協調控制等場景的泛化能力。隨著AstraBrain-WBC系列模型持續迭代,公司希望建立面向下一代人形機器人的通用運動控制基礎架構,推動具身智能從實驗室研究走向大規模商業應用。(編輯部)