11月,Google低調推出全新的影像生成旗艦—— Nano Banana Pro。它不僅是一個畫圖工具,更被科技圈一致形容為「能想、能判斷、能生成」的全能影像怪獸,甚至有人說它正式宣告AI生圖從「能用」進入「可替代專業」的新時代。
AI生圖第一次像「真的會思考」
Nano Banana Pro是Google最新、也是目前最強大的AI影像生成模型。它不只繪圖,還會「思考」。Google在這一代導入了全新的Thinking模式,讓模型在開始生成前,會先分析你的需求、設計構圖、檢查邏輯,再開始下筆。
因此它不會再畫出五根手指變六根、液體逆向漂浮這種老問題,而是能像專業設計師一樣兼顧美感與邏輯。
它的核心則來自Gemini 3 Pro的多模態能力,因此對語意、物體結構、世界知識的理解都更深層,產出的內容也具備4K商用級的細節與解析度。
到底有多強?
Nano Banana Pro的誕生,被業界視為AI生圖正式「成年」的象徵。
最先讓網友炸裂的,是它能直接把一份 50 多頁的NVIDIA財報PDF丟進去,並在數秒後自動生成一張編排乾淨、重點明確的資訊圖表。一般 AI 工具都做不到的「專業報表可視化」,Nano Banana Pro 卻做得像財務分析師 + 資訊設計師聯手打造。
類似的強度也表現在技術示意圖中。當使用者要求它畫出「自行車的爆炸視圖(Exploded View)」時,Nano Banana Pro準確繪製出拆解後的齒輪、鏈條、輪框、連接位置,甚至附上毫米尺寸註記。這種等級的技術圖,以往是工程系學生或專案設計師才能產出,如今AI幾秒就能生成。
在圖像融合方面,Nano Banana Pro 支援最多14張參考圖。例如:「把這 14 隻玩偶放到同一張沙發上一起看電視。」
它不只把玩偶擺得整整齊齊,連燈光反射、布料紋理、毛絨邊緣、窗戶倒影,都忠實呈現。雖然一般使用者初次測試時未能完整出現14隻,但Google官方案例已證實它能做到,差別只在提示詞是否夠精準。
此外,Nano Banana Pro的文字渲染能力直接打趴所有競品。無論是海報標語、漫畫對白、招牌字體,全部都能正確呈現,不再是過去的外星文或錯字。這意味著:AI能夠直接生成商用級海報,不需要再用Photoshop補字。
人人都能上手的強大工具
想體驗Nano Banana Pro,其實非常簡單。一般人只要打開Gemini,點選「Create Images」,再切換到「Thinking 模式」,就能啟動這個Pro級模型。
如果你是社群編輯,你可以直接說:「幫我畫一張12月聖誕促銷海報。」
如果你是設計師,你可以逐步修改:「把光影調暖、背景換成街景、字體變粗。」
如果你是開發者,則能透過Google AI Studio或API進行大量生成與細節調整。
進入Pro模式後,它會像人類合作夥伴一樣與你對話、修圖、修改、再生成,比起傳統提示詞工具更直覺、更接近真實工作流程。
從技術圖到漫畫分鏡全領域支配
Nano Banana Pro 的驚人爆發力,靠的是大量真實案例支撐。
技術層面上,它能生成工程級的三視圖、爆炸圖、流程框架、資訊圖表。
創意層面上,它能把「靈魂草稿」變成唯美插畫、把人物照片延伸成完整故事分鏡,甚至能根據球員資料自動生成世界杯對決海報。
透明材質的生成尤其被稱為「突破性躍升」。玻璃折射、液體透光、光影邊緣都具備物理正確性,讓許多攝影師直呼:「這根本是高端渲染,而不是 AI。」
甚至 Google CEO皮采本人也親自示範,生成一張他與哈薩比斯同框的圖,呼應工程級效果:「它能產生工程師看世界的方式。」這句話讓 Nano Banana Pro 在工程、學術與設計圈瘋狂傳播。
社群小編能用它快速生成海報,設計師能用它合成多風格視覺,工程人員能用它繪製技術圖,研究者能瞬間獲得論文結構圖,而一般使用者也能得到 4K 的高質感作品。
換句話說,它不再是「給玩家玩玩」的工具,而是第一個真正能放進生產線的影像 AI。 (編輯部)