Google 於19日凌晨正式發表全新旗艦模型 Gemini 3,被官方形容為迄今「最智能、最可靠、最具推理深度」的AI系統,並同步向全球 Gemini 應用使用者全面開放。其中主力版本Gemini 3 Pro直接在首發日登上 LMArena 等多項基準測試榜首,甚至在部分核心能力上超越剛推出的 GPT-5.1,被外界視為 Google 重奪AI領先地位的重大一役。
Gemini 3 最大的變革在於其原生多模態能力與深度推理架構。Google DeepMind 技術長 Koray Kavukcuoglu 形容,Gemini 3 的願景是讓使用者能「把任何想法變為現實」,模型不僅能同時理解文字、圖片與影音,也能參與長程規劃、編寫複雜程式碼,甚至能自行生成完整的互動介面。這些特性體現於 Google 所稱的「生成式介面」——一種可根據指令即時生成全新視覺佈局、模組與操作邏輯的動態 UI,使互動不再侷限文字回答,而能呈現如雜誌排版、互動式教學頁面或模擬工具等全新形式。
Google 以現場示例展示這種能力的具體進展。若使用者要求規劃三天羅馬旅程,Gemini 3 不再只提供列點,而是自動生成帶照片、可展開內容區塊與可互動推薦路線的動態版面。若要求理解梵谷畫作,其生成的頁面還能附帶滑動、圖像放大以及作品背景故事等操作邏輯,呈現一個「即時打造的微型網站」。Google 認為這將徹底改寫人們對「AI 回答」的想像。
性能方面,Gemini 3 Pro 在推理與準確性上大幅升級。在 GPQA、HLE、MathArena、MMMU-Pro、Video-MMMU 等難度極高的評測中均創下新高分,展現博士級邏輯推理能力與多模態理解深度。Google 特別強調,新版模型在事實精準度上的改善明顯,能夠避開 AI 常見的「幻覺」問題。Google 更以帶弦外之音的說法表示,Gemini 3 Pro 不會像某些 AI「習慣無意義奉承」,而是提供更直接、可靠、去除客套的回答。外界認為這是向近日被批評「過度討好」的 ChatGPT隱晦開刀。
能以單一指令建立完整3D遊戲
在應用場景上,Gemini 3 Pro 展示了更強的工程與創作能力。它能以單一指令建立完整 3D 遊戲、生成包含音效的手機遊戲版本《Ridiculous Fishing》,甚至在一次輸出中編寫 Game Boy 模擬器。這些演示顯示其在「氛圍程式設計(Vibe Coding)」領域的突破:使用者只需描述想要的氛圍或互動形式,模型便能自動生成 UI、後端邏輯與可運作的遊戲機制。
Google 同步啟動新的智能體開發平台 Google Antigravity,結合 Gemini 3 的工具使用與程式規劃能力,讓 AI 能自行規劃並執行端到端軟體任務,包括同時操作瀏覽器、終端機與編輯器。這意味著開發者未來不必逐步下指令,而能直接以「任務目標」請 AI 完成整個專案。Google 表示,這是邁向長時間自主運作智能體的重要一步。
在搜尋方面,Gemini 3 Pro 已即時接入 Google Search 的 AI Mode,提供以圖片、表格、互動模擬與動態網格等方式呈現的結果頁面。Google 稱其升級的「查詢扇出」技術能更精準拆解問題,並找出過去搜尋可能忽略的內容。對於 Google 一直強調的「讓資訊更有用」願景,這次更新被視為一次重大調整。 (編輯部)