谷歌近日推出全新圖像生成模型Nano Banana 2,在分辨率、生成一致性及多語言支持方面實(shí)現(xiàn)顯著突破。該模型基于Gemini 3.1 Flash Image架構(gòu)升級(jí),圖像輸出分辨率從2K提升至4K,同時(shí)優(yōu)化了文本渲染精度與畫面元素融合能力。據(jù)實(shí)測(cè)反饋,此前版本存在的中文字符亂碼、語義錯(cuò)亂及畫面?zhèn)斡暗葐栴}已得到大幅改善。
技術(shù)整合方面,Nano Banana 2融合了Gemini Flash的極速響應(yīng)特性與Nano Banana Pro的龐大知識(shí)庫,支持在單一工作流中保持最多5個(gè)角色形象的一致性,并可實(shí)現(xiàn)單張畫面內(nèi)14個(gè)元素的有機(jī)融合。模型創(chuàng)新性地引入實(shí)時(shí)網(wǎng)絡(luò)搜索功能,可動(dòng)態(tài)調(diào)用最新信息輔助圖像生成,同時(shí)支持圖像內(nèi)文本的精準(zhǔn)翻譯與多語言渲染。
在應(yīng)用場(chǎng)景拓展上,該模型將覆蓋Gemini應(yīng)用、谷歌搜索(AI模式與Lens)、Google AI Studio等12個(gè)核心產(chǎn)品平臺(tái),服務(wù)范圍擴(kuò)展至141個(gè)新增國家和地區(qū),并支持8種新語言環(huán)境。其中,Gemini應(yīng)用將默認(rèn)啟用Nano Banana 2替代原Pro版本,但專業(yè)版與旗艦版訂閱用戶仍可通過菜單選項(xiàng)切換回舊版模型。
據(jù)開發(fā)團(tuán)隊(duì)披露,新模型通過改進(jìn)的注意力機(jī)制與多模態(tài)對(duì)齊算法,顯著提升了復(fù)雜場(chǎng)景下的元素協(xié)調(diào)性。在涉及多人物互動(dòng)或混合文化元素的測(cè)試案例中,系統(tǒng)展現(xiàn)出了更強(qiáng)的語義理解能力,能夠準(zhǔn)確呈現(xiàn)不同語言背景下的視覺表達(dá)需求。這一升級(jí)或?qū)⑼苿?dòng)生成式AI在廣告設(shè)計(jì)、教育內(nèi)容制作等領(lǐng)域的深度應(yīng)用。






