谷歌近日正式發布了新一代圖像生成模型Nano Banana 2,該模型基于Gemini 3.1 Flash Image架構開發,在響應速度、語義理解能力以及提示詞解析精準度方面實現顯著提升。相較于前代產品,新模型不僅優化了核心性能,還針對性解決了中文用戶長期面臨的字符顯示異常問題。
技術團隊重點改進了模型的多語言處理能力,通過優化字符編碼機制,成功消除此前版本中普遍存在的中文亂碼現象。測試數據顯示,在處理復雜語義的中文提示時,新模型的文本還原準確率提升至98.7%,同時有效減少了畫面中出現非預期偽影的概率。針對角色一致性難題,開發人員引入動態特征綁定技術,使模型能夠在跨圖像生成時保持最多5個角色形象的高度統一。
在圖像質量維度,Nano Banana 2將輸出分辨率上限從2K提升至4K,并支持單張畫面融合多達14個獨立元素。通過改進的注意力分配算法,模型能夠更精準地解析包含多重條件的復雜提示,例如"在雨夜的城市街道上,穿著紅色風衣的長發女子牽著金毛犬,背景需包含霓虹招牌和復古路燈"這類詳細描述。
該模型將通過分階段部署策略逐步替代舊版本,首批上線平臺包括谷歌Gemini智能助手、Google AI Studio開發環境以及Google Flow創意工具套件。商業用戶可通過付費API接口調用增強版功能,廣告客戶則能在Google Ads系統中直接使用模型生成營銷素材。開發團隊透露,后續版本計劃引入3D場景構建能力,并優化對小眾語言的支持效率。













