近年AI生成圖片熱潮持續升溫,繼ChatGPT帶動「吉卜力風」「像素風」等創作風潮後,海外近期興起「照片模型手辦化」玩法,讓個人照片瞬間變身為PVC公仔般的立體人偶。這一玩法背後的技術,正是谷歌於8月26日正式推出的Gemini 2.5 Flash Image(代號Nano Banana)模型。
目前,Gemini已將Nano Banana模型直接整合至首頁,用戶無需再額外登入Google AI Studio,就能透過首頁帶有香蕉Emoji的「用Imagen生成圖像」按鈕啟動生圖。只要點擊該按鈕,上傳一張照片,再輸入提示詞(Prompt),系統便能在短短十餘秒內完成圖像生成。這種「一鍵手辦化」的便利性,使其在海外網路社群迅速走紅,成為繼吉卜力、像素風後的最新AI創作潮流。
提示詞在這裡
實際操作十分簡單,用戶僅需兩步即可完成:第一步,打開Google AI Studio(或直接從Gemini首頁進入),選擇「Nano Banana」模型,並上傳想要轉換的照片。第二步,輸入提示詞(Prompt)。例如:「Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is the Zbrush modeling process of this figurine. Next to the computer screen is a packaging box with rounded corner design and a transparent front window, the figure inside is clearly visible.」
該指令意思是:將照片中的人物製作成1/7比例的寫實商品化手辦,放在電腦桌上,配備透明壓克力底座,電腦螢幕顯示建模過程,旁邊放置圓角設計的透明窗口包裝盒。輸入後僅需10至12秒,即可生成效果圖。
精準回應用戶需求
Nano Banana的技術優勢在於它能夠融合多張影像並保持角色一致性,增強了敘事與表現力。同時,它可透過自然語言進行針對性變換,並運用Gemini龐大的世界知識庫生成或編輯影像,讓AI生成不再只是隨機疊加,而是能精準回應用戶需求。例如用戶希望模型站在透明壓克力底座上,背景出現帶有透明窗口的紙盒包裝,Nano Banana都能完整呈現,且效果極為擬真。
實際測試顯示,即使是缺少部位的照片,AI也能自動補全,如原圖人物沒有腳,生成後會自動繪製完整造型,臉部角度亦能自然調整。寵物照片則能生成極具立體感的模型,連項圈和牽繩細節也能自動補強,呈現極高擬真度。
更多模型選擇
若想對生成圖片進行調整,用戶可直接修改Prompt,例如刪除特定部位或改變背景,再次生成即可。例如,刪除人物的手或更換場景,只需在原有指令中加入描述,即可快速完成修改。這使得「Nano Banana」在靈活性與可玩性上大幅提升。
除了「Nano Banana」,用戶在Google AI Studio左側的「生成媒體」欄目中還能找到更多模型,目前介面以英文為主,但可透過瀏覽器翻譯功能切換中文。用戶可探索不同模型,以體驗各種AI生圖風格。 (編輯部)