作者 | 程茜
編輯 | 李水清
Seedance 2.0的熱度還沒(méi)下去,字節(jié)新模型又來(lái)了!
智東西2月10日?qǐng)?bào)道,今日,字節(jié)圖像生成模型Seedream 5.0在視頻編輯應(yīng)用剪映、剪映海外版Capcut、字節(jié)AI創(chuàng)作平臺(tái)小云雀均已上線,在即夢(mèng)AI平臺(tái)開(kāi)啟灰度測(cè)試,圖片生成可限時(shí)免費(fèi)體驗(yàn)。
Capcut官宣截圖(左)、小云雀主頁(yè)模型選擇(右)
Seedream 5.0的圖像支持2K和4K分辨率輸出,2K為圖片生成直出,4K為AI增強(qiáng)后的分辨率。根據(jù)Capcut官網(wǎng),新模型5.0的升級(jí)點(diǎn)為首次支持檢索生圖,對(duì)提示詞的理解準(zhǔn)確性增強(qiáng)、支持更細(xì)節(jié)、精致紋理的圖像生成,還允許用戶精確調(diào)整圖像。Seedream 4.5于2025年12月4日上線。
智東西實(shí)際體驗(yàn)并對(duì)比了Seedream 5.0與Nano Banana Pro、Seedream 4.5,發(fā)現(xiàn)新模型可以理解“靜謐科技感”等抽象提示詞,但最后的生成效果相比Seedream 4.5很難說(shuō)有跨越式提升,其聯(lián)網(wǎng)搜索能力尚不穩(wěn)定、生成效果升級(jí)點(diǎn)體現(xiàn)在更美觀、多樣化上。
Capcut的官宣推文里提到,Seedream 5.0可與Nano Banana Pro對(duì)標(biāo),且更便宜,目前所有用戶可免費(fèi)使用20次,美國(guó)地區(qū)之后上線。有網(wǎng)友對(duì)比了Nano Banana Pro、ChatGPT、Seedream 5.0、Grok Imagine Image的生成效果,其提示詞為:生成一張高質(zhì)量的信息圖,解釋在特拉普修道院制作啤酒的過(guò)程,并配有豐富的插圖。
第一排從左至右為Nano Banana Pro、ChatGPT生成,第二排從左至右為Seedream 5.0、Grok Imagine Image生成
相比于其他幾個(gè),Seedream 5.0的步驟解釋最為詳細(xì),每步都有詳細(xì)的文字說(shuō)明,但藝術(shù)設(shè)計(jì)感相比Nano Banana Pro稍弱。
從社交平臺(tái)X上的網(wǎng)友評(píng)論來(lái)看,此次Seedream 5.0預(yù)覽版的升級(jí)優(yōu)先考慮的是智能水平而非美觀,可以應(yīng)對(duì)復(fù)雜的知識(shí)驅(qū)動(dòng)型任務(wù)。
有網(wǎng)友認(rèn)為,Seedream 5.0的智能水平、中文能力有提升,但都比不上Nano Banana Pro。
還有網(wǎng)友調(diào)侃,新模型的進(jìn)步程度僅0.09,僅相當(dāng)于加了網(wǎng)絡(luò)搜索的Seedream 4.5。
一、三大能力增強(qiáng),主攻實(shí)用性需求
根據(jù)Capcut官網(wǎng),此次Seedream 5.0的重要升級(jí)點(diǎn)包括準(zhǔn)確性與智能水平增強(qiáng)、更快更具表現(xiàn)力的圖像創(chuàng)建、支持聯(lián)網(wǎng)知識(shí)整合。
首先在智能水平方面,Seedream 5.0能深入理解提示詞,生成與用戶意圖相匹配、細(xì)節(jié)精準(zhǔn)、布局清晰、文本渲染效果更佳的圖像。
第二點(diǎn)是增強(qiáng)風(fēng)格化效果,其圖像到圖像功能增強(qiáng)了風(fēng)格化效果,模型可以提供更清晰的細(xì)節(jié)、精致的紋理和平衡的照明。該模型還新增了編輯功能,用戶可以控制筆刷精準(zhǔn)選擇并調(diào)整相應(yīng)元素。
最后是智能推理能力,其官網(wǎng)提到,新模型的多步邏輯、空間理解及特定領(lǐng)域知識(shí)增強(qiáng)。
二、相較Seedream 4.5提升小,能理解抽象需求
智東西體驗(yàn)了Seedream 5.0的圖片生成能力。
第一個(gè)提示詞是“為《靜夜思》生成古詩(shī)插圖”,可以看到生成的結(jié)果中人物“舉頭望明月”這一關(guān)鍵元素都沒(méi)有缺失,還附上了人物在月光下的影子等,但原詩(shī)中的“床前”等沒(méi)有在圖片中涉及到。
為了考驗(yàn)Seedream 5.0的聯(lián)網(wǎng)搜索能力,智東西輸入了提示詞“最近有很多家機(jī)器人都要參加2026春晚,生成一張已官宣參加春晚的機(jī)器人海報(bào)”。
Seedream 5.0生成的視覺(jué)元素準(zhǔn)確,在大段文字生成中也未出現(xiàn)亂碼,表現(xiàn)穩(wěn)定。但其并沒(méi)有理解“已官宣參加春晚的機(jī)器人”,而是僅生成了機(jī)器人上春晚的海報(bào)。
還有抽象的提示詞,智東西輸入“生成一個(gè)靜謐科技感且?guī)в新淙沼鄷煼諊聂[鐘圖片”,新模型生成的圖片中,從鬧鐘的設(shè)計(jì)到背景將落日、科技感融合在了一起。
關(guān)于更為細(xì)致的圖像輸出,提示詞為“特寫(xiě)電影感肖像,一位有雀斑、深色卷發(fā)的年輕女性,被鮮艷的野花和藤蔓環(huán)繞,頭上戴著花冠。在黃金時(shí)段拍攝,溫暖的逆光在她的頭發(fā)和皮膚上形成光暈,淺景深,前景花朵柔焦,照片級(jí)真實(shí)感”。
可以看到,輸出的圖片中的逆光效果非常到位,發(fā)絲邊緣的光暈、皮膚的光澤以及前景花朵的柔焦虛化,都營(yíng)造出了自然的氛圍感。
當(dāng)智東西的提示詞為“最新奧斯卡獲獎(jiǎng)?wù)呒t毯風(fēng)格”時(shí),Seedream 5.0可以直接生成有紅毯、背景板、攝影師的完整圖像,背景板還有不少奧斯卡的小金人。
根據(jù)參考圖生成圖片方面,智東西上傳了最近熱度超高的《閃靈》男主杰克,并讓Seedream 5.0“生成這個(gè)人的拜年圖片,主人公要身有年味的服裝,手拿燈籠和對(duì)聯(lián)”。
生成的效果中,主人公的面部與參考圖一致,手拿燈籠、對(duì)聯(lián)的元素也都具備。
智東西還比較了Seedream 5.0與Nano Banana Pro的生成效果。一個(gè)超難提示詞為“生成一個(gè)用左手寫(xiě)字的人,背景有一個(gè)顯示5:25的模擬時(shí)鐘”,Seedream 5.0與Nano Banana都失敗了,要么是拿筆的手不對(duì),要么是背景的鐘表時(shí)間不對(duì)。
Nano Banana Pro生成的圖片中,人物握筆的手為左手,可以從模糊的時(shí)鐘看出其時(shí)間為5:30左右。
Nano Banana生成的圖片
雖然Seedream 5.0有些圖片生成的并不準(zhǔn)確,但其一次性生成的圖片更具多樣性,從現(xiàn)代風(fēng)、古風(fēng)到卡通都有。
Seedream 5.0生成的圖片
在比較Seedream 4.5和Seedream 5.0時(shí),智東西上傳的提示詞是“幫我生成西紅柿炒雞蛋的菜譜,卡通風(fēng)格”。相比之下,Seedream 5.0的整體排版、架構(gòu)設(shè)計(jì)會(huì)更為美觀。
上為Seedream 4.5生成的圖片,下為Seedream 5.0生成的圖片
結(jié)語(yǔ):圖像模型正朝實(shí)用能力升級(jí)迭代
當(dāng)前頭部圖像模型的迭代路徑,正朝著提升理解能力、可控生成、編輯精度等實(shí)用能力升級(jí)。
從Seedream 5.0的升級(jí)來(lái)看,其選擇在檢索增強(qiáng)、細(xì)節(jié)紋理、精準(zhǔn)調(diào)整、4K增強(qiáng)上做優(yōu)化,生成的結(jié)果并沒(méi)有顛覆性效果,這或許更貼近用戶的實(shí)際需求。但從實(shí)測(cè)與輿論反饋來(lái)看,用戶對(duì)小版本迭代的感知正在變?nèi)酰绕湓诔橄笳Z(yǔ)義理解、文字渲染、復(fù)雜邏輯構(gòu)圖等方面仍存在技術(shù)瓶頸。











