人工智能晶片龍頭英偉達(NVIDIA)在2026年GTC全球開發者大會上公布多項重大技術與產品更新,包括新一代晶片平台、未來GPU與CPU路線圖、推理加速器,以及面向太空與醫療機器人的人工智能系統。行政總裁黃仁勳在開幕演講中表示,人工智能正進入以「推理」(inference)為核心的新階段,全球算力需求正迅速爆發。
黃仁勳指出,過去兩年間整體運算需求已增加約100萬倍,而隨著人工智能應用從模型訓練逐步轉向大規模推理,算力需求將持續急速上升。他預計,到2027年,基於Blackwell與Vera Rubin架構的人工智能晶片市場規模有望達到1萬億美元,甚至可能出現供應不足的情況。
在此次GTC大會上,英偉達公布了2026年至2028年的最新晶片路線圖。公司確認下一代GPU架構Rubin及其後繼架構Feynman的發展計劃,並首次披露將與Feynman GPU配套的新CPU代號為Rosa。該架構將採用更先進的3D芯粒堆疊封裝技術,並配備定制高頻寬記憶體(HBM),以提升人工智能運算效率。
在互聯技術方面,英偉達透露Feynman平台將支援新一代NVLink 8互連架構,並引入共封裝光學(CPO)技術,使光學互聯不僅能用於資料中心之間的橫向擴展,也可用於機架內的縱向擴展,進一步提升大型人工智能系統的整體性能。
第七顆核心晶片
為搶攻人工智能推理市場,英偉達同時發布新的推理加速晶片Groq 3 LPU。這款晶片整合來自AI晶片新創Groq的語言處理單元技術,採用500MB SRAM記憶體架構,不需要昂貴的HBM,能以更低成本與功耗提供更高的推理速度。黃仁勳表示,Groq 3 LPU將成為Vera Rubin人工智能平台中的「第七顆核心晶片」。
英偉達同時推出Groq 3 LPX機架系統,單一機架可部署256顆LPU,並與Vera Rubin NVL72機架系統整合運作。黃仁勳指出,在新系統架構下,人工智能運算效率相較上一代系統可提升35倍,並有望為客戶帶來最高10倍的營收潛力。
除了資料中心領域,英偉達亦將人工智能運算拓展至太空。公司宣布推出用於「軌道資料中心」的運算平台,其中Vera Rubin Space-1模組整合IGX Thor與Jetson Orin晶片,專為衛星及太空任務設計,能在尺寸、重量與功耗受限的環境中運作。
部署太空算力
該計畫將與多家航太企業合作,包括Axiom Space、Starcloud及Planet。黃仁勳表示,隨著衛星星座部署與深空探索發展,未來人工智能運算需要部署在資料產生的地方,而太空將成為新的算力前沿。不過他亦坦言,在太空環境中冷卻高性能運算系統仍存在工程挑戰,因為太空中沒有對流,只能依靠輻射散熱。
醫療機器人AI平台
在應用層面,英偉達亦推出面向醫療機器人的專用人工智能平台。該平台包括全球最大的醫療機器人數據集Open-H、開放模型家族Cosmos-H、機器人控制模型GR00T-H以及醫院模擬開發工具Rheo。其中Open-H包含776小時手術視頻數據,可用於訓練醫療機器人模型,而Cosmos-H與GR00T-H則可讓人工智能理解臨床任務並生成機器人動作指令。
黃仁勳在演講中以「五層蛋糕」比喻人工智能技術堆疊,從底層能源、晶片、基礎設施與平台,到最終的應用程式。他指出,生成式人工智能在2023年爆發,2024年進入推理階段,而2025年則開始邁向AI代理(Agent)時代。隨著人工智能逐步具備完成實際工作的能力,推理需求將成為未來算力市場的核心動力。
「人工智能現在終於能真正做出有生產力的工作,」黃仁勳說,「推理的轉折點已經到來。」 (編輯部)