阿里巴巴近日宣布推出一款名為Wan2.7-Image的圖像生成與編輯統(tǒng)一模型,旨在突破傳統(tǒng)AI圖像生成工具的局限性,為用戶提供更自由、更精準(zhǔn)的創(chuàng)作體驗(yàn)。該模型通過全鏈路技術(shù)升級(jí),解決了AI生成圖像中常見的“標(biāo)準(zhǔn)臉”問題,并顯著提升了指令理解與視覺效果的匹配度。
在虛擬形象生成方面,Wan2.7-Image實(shí)現(xiàn)了從骨骼結(jié)構(gòu)到面部細(xì)節(jié)的全方位定制功能。用戶可自由調(diào)整骨相輪廓、眼眸形態(tài)及五官比例,徹底告別千篇一律的“AI臉”,真正實(shí)現(xiàn)“千人千面”的個(gè)性化創(chuàng)作。這一突破得益于模型對(duì)人類面部特征的深度解析能力,能夠精準(zhǔn)捕捉并還原微表情差異。
針對(duì)色彩應(yīng)用場(chǎng)景,模型創(chuàng)新推出“調(diào)色盤”功能。用戶通過提取或輸入?yún)⒖紙D中的色彩參數(shù),即可生成同色系圖像,并可自由調(diào)節(jié)色彩數(shù)量與占比。這項(xiàng)功能為設(shè)計(jì)師提供了高效的配色工具,特別適用于需要統(tǒng)一視覺風(fēng)格的多圖創(chuàng)作場(chǎng)景。
在圖像編輯領(lǐng)域,Wan2.7-Image展現(xiàn)出強(qiáng)大的交互能力。其“精準(zhǔn)框選編輯”功能支持在指定區(qū)域內(nèi)進(jìn)行元素添加、位置調(diào)整及對(duì)齊操作,實(shí)現(xiàn)像素級(jí)意圖匹配。更值得關(guān)注的是,該模型突破單圖生成限制,支持最高12張組圖的協(xié)同創(chuàng)作,為敘事性視覺內(nèi)容開發(fā)開辟新路徑。
文字渲染能力是該模型的另一技術(shù)亮點(diǎn)。通過優(yōu)化生成架構(gòu),模型可處理超長(zhǎng)文本輸入(最高3K token),輸出達(dá)到印刷標(biāo)準(zhǔn)的文字效果。無(wú)論是多語(yǔ)言混排、復(fù)雜數(shù)學(xué)公式還是表格數(shù)據(jù),均能保持結(jié)構(gòu)完整性與視覺清晰度,甚至支持直接生成A4紙篇幅的學(xué)術(shù)論文。
技術(shù)架構(gòu)層面,Wan2.7-Image采用生成與理解統(tǒng)一框架,在共享隱空間實(shí)現(xiàn)語(yǔ)義映射。這種設(shè)計(jì)使模型擺脫了傳統(tǒng)“文字猜像素”的生成模式,具備真正的語(yǔ)義理解能力。同步上線的Pro版本進(jìn)一步優(yōu)化了構(gòu)圖穩(wěn)定性與指令解析精度,為專業(yè)用戶提供更可靠的創(chuàng)作支持。






