科技媒體9to5Mac報道,蘋果公司近日在 Hugging Face 平台上推出FastVLM 視覺語言模型的瀏覽器試用版,專為搭載Apple Silicon晶片的Mac設備設計,主打「閃電般」的影片字幕生成速度。
FastVLM 由蘋果基於自研開源機器學習框架MLX優化,體積僅同類模型的三分之一,但字幕生成速度快85倍。此次發布的FastVLM-0.5B輕量版可直接在瀏覽器內運行,無需依賴雲端。根據測試,在16GB M2 Pro MacBook Pro 上首次加載需數分鐘,但啟動後能迅速且精準地描述畫面中的人物、環境、表情與物體。
值得關注的是,FastVLM支持本地運行,數據全程在設備端處理,避免隱私風險。其低延遲與高效率特性,亦使其在可穿戴設備、虛擬攝像頭應用與輔助技術領域展現潛力。未來,FastVLM有望成為相關產品的核心技術,為用戶帶來更智能便捷的交互體驗。(編輯部)