中國AI公司智譜正式發布新一代開源模型GLM-5.1,主打長時間自主運作能力,並同步上調價格約10%。公司稱,該模型為目前全球最強的開源模型之一,亦是首個可持續工作長達8小時的開源AI系統。
智譜表示,GLM-5.1在長程任務(Long-Horizon Task)方面取得突破,能在單一任務中持續進行規劃、執行與優化,並完成工程級成果,從傳統數分鐘交互,提升至數小時連續工作能力。
在多項代碼能力測試中,GLM-5.1表現領先,包括SWE-Bench Pro、Terminal-Bench及NL2Repo等基準測試,整體排名全球第三、開源模型第一。在最接近實際軟件開發場景的SWE-Bench Pro測試中,該模型更首次超越Claude Opus 4.6,刷新全球紀錄。
商業化方面,OpenRouter數據顯示,GLM-5.1價格已上調約10%,在編程場景的Token定價接近Anthropic旗下Claude Sonnet 4.6,為中國開源模型首次在核心應用領域實現與海外頭部產品價格對齊。(編輯部)