小米4月30日宣布推出並開源首款為推理任務打造的大模型「 Xiaomi MiMo 」,標誌該公司邁入通用人工智能(AGI)研發新階段。MiMo由小米大模型 Core 團隊研發,主打類人推理能力,類似於中國初創公司深度求索的 DeepSeek-R1。
MiMo在數學推理(AIME 24-25)與程式碼測評(LiveCodeBench v5)表現出色,在僅7B參數規模下即超越OpenAI o1-mini與阿里Qwen-32B開源模型,顯示強化學習潛力明顯領先。
小米指出,MiMo的推理能力來自創新的預訓練與後訓練策略。在預訓練階段,合成約200B推理語料並經歷三階段訓練;後訓練方面,則引入Test Difficulty Driven Reward與Easy Data Re-Sampling演算法,並透過Seamless Rollout框架使訓練加速2.29倍。
MiMo-7B全系列已開源,小米強調:「 2025看似是大模型逐夢後半程,但AGI征途仍漫長。」該模型發布緊接阿里新一代Qwen3,突顯中國科技巨頭在AI領域競爭日益激烈。
小米推出開源大模型「 Xiaomi MiMo 」。 (網絡圖片)