人工智能(AI)技術正出現新一輪路線轉向,「世界模型」(World Models)近期迅速成為產業焦點。在資本市場與科技巨頭雙重推動下,這一被視為「下一代AI」的技術方向,正從概念走向實際競爭。
所謂世界模型,核心在於讓AI不僅依賴既有數據生成內容,而是能在「潛在空間」(Latent Space)中建立對現實世界的抽象理解,包括物理規律、商業邏輯與情境關係,進而模擬不同決策可能帶來的結果。相較於大型語言模型(LLM)以逐字生成為主,世界模型更接近「推演與理解」,可支援What-if分析與策略判斷,被視為通往更高階通用人工智能(AGI)的關鍵路徑。
這一方向近期快速升溫,與資金大舉流入密切相關。AI先驅Yann LeCun創辦的AMI Labs,以及Fei-Fei Li創立的World Labs,近期分別完成逾10億美元融資,凸顯市場對世界模型潛力的高度押注。
與此同時,科技巨頭亦加快布局。Alibaba Group近日推出世界模型「Happy Oyster」,進一步擴大其AI版圖。該模型不僅能生成最長達三分鐘的影片,顯著超越目前主流約15秒的生成能力,更強調在生成過程中具備即時回應與調整能力,可模擬物理世界運作,潛在應用涵蓋遊戲、影視製作,甚至人形機器人訓練。
與強化學習高度互補
Google亦在相關領域持續推進,其世界模型Genie 3可透過簡單文字生成可即時探索的虛擬環境;中國AI影片初創ShengShu Technology亦已切入相關賽道。市場同時關注Tencent等企業,正加大對世界模型與多模態AI的投入,顯示中美科技巨頭已同步進入競爭階段。
從技術路徑看,世界模型與強化學習(Reinforcement Learning)具高度互補性。前者負責建立環境運作邏輯,後者則在模擬環境中優化行為策略。業界認為,若兩者結合成熟,有望降低AI對大規模標註數據的依賴,並拓展至藥物研發、物理建模及企業決策等高價值場景。
不過,隨着能力提升,風險問題亦逐漸浮現。分析指出,世界模型涉及更複雜的內部推理機制,其安全與可解釋性挑戰,可能不同於現有生成式AI框架,企業在導入相關技術時,需同步強化測試與治理機制。
世界模型被視為AI從「內容生成工具」邁向「決策與推演系統」的重要轉折。隨着資本與巨頭持續加碼,該領域競爭正迅速升溫,未來發展將取決於技術落地能力、風險控制,以及能否轉化為可衡量的商業回報。 (編輯部)