中國人工智能企業智譜近日宣布,正式開源其核心AI Agent模型AutoGLM。該模型具備「Phone Use(手機操作)」能力,能夠辨識手機畫面內容並模擬人類完成點擊、輸入、滑動等操作,目前已可穩定執行外賣點單、機票預訂等包含數十個步驟的複雜工作流程。
隨着 AutoGLM 對外開源,硬件廠商、手機製造商及開發者可基於該模型,在自身設備或系統環境中部署具備實際操作能力的 AI 助手,實現對螢幕內容的理解與動作操作結合。據悉,AutoGLM 已支援微信、淘寶、抖音、美團等逾50個高頻中文App的核心應用場景。
智譜表示,此次開源有助大幅降低 AI 手機的技術門檻,推動行動端 AI 生態從封閉模式轉向開放共創的新階段。該項目同時支援本地端與雲端部署,確保數據處理與隱私控制權由使用者自行掌握,兼顧功能便利性與資料安全需求。(編輯部)