小米推出開源推理大模型 MiMo

強化學習效能領先競爭對手
02/05/2025
5200
收藏
分享
強化學習效能領先競爭對手

小米4月30日宣布推出並開源首款為推理任務打造的大模型「 Xiaomi MiMo 」,標誌該公司邁入通用人工智能(AGI)研發新階段。MiMo由小米大模型 Core 團隊研發,主打類人推理能力,類似於中國初創公司深度求索的 DeepSeek-R1。

MiMo在數學推理(AIME 24-25)與程式碼測評(LiveCodeBench v5)表現出色,在僅7B參數規模下即超越OpenAI o1-mini與阿里Qwen-32B開源模型,顯示強化學習潛力明顯領先。

小米指出,MiMo的推理能力來自創新的預訓練與後訓練策略。在預訓練階段,合成約200B推理語料並經歷三階段訓練;後訓練方面,則引入Test Difficulty Driven Reward與Easy Data Re-Sampling演算法,並透過Seamless Rollout框架使訓練加速2.29倍。

MiMo-7B全系列已開源,小米強調:「 2025看似是大模型逐夢後半程,但AGI征途仍漫長。」該模型發布緊接阿里新一代Qwen3,突顯中國科技巨頭在AI領域競爭日益激烈。

小米推出開源大模型「 Xiaomi MiMo 」。 (網絡圖片)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報