OpenAI的圖像生成技術(shù)即將迎來重大升級(jí)。據(jù)社交平臺(tái)X上的消息,OpenAI正在通過Chatbot Arena測試新一代圖像模型GPT-Image-2,測試期間使用了maskingtape-alpha、gaffertape-alpha和packingtape-alpha等代號(hào)。盡管相關(guān)測試頁面已暫時(shí)下線,但部分ChatGPT用戶已開始體驗(yàn)灰度版本。
新模型最引人注目的改進(jìn)是徹底解決了長期存在的"黃色濾鏡"問題。自DALL·E時(shí)代起,用戶就發(fā)現(xiàn)生成的圖像普遍帶有暖色調(diào)光暈,即便在GPT-Image-1中有所改善,但冷色調(diào)科技場景仍會(huì)意外出現(xiàn)溫暖光暈。實(shí)測顯示,GPT-Image-2生成的圖像色彩還原精準(zhǔn),能夠完美呈現(xiàn)用戶要求的冷色調(diào)場景。
文字渲染能力的突破堪稱革命性進(jìn)步。此前AI模型在生成文字時(shí)普遍存在亂碼問題,店鋪招牌的字母常呈現(xiàn)扭曲狀態(tài)。GPT-Image-2不僅成功生成了包含多語言電子廣告牌的賽博朋克場景,還能精確呈現(xiàn)網(wǎng)頁截圖和解剖圖的專業(yè)標(biāo)注。特別值得關(guān)注的是手寫筆記的生成效果,筆跡自然流暢,仿佛真實(shí)用筆書寫而成。
盡管文字渲染仍有提升空間——某次生成李白《靜夜思》草書時(shí)出現(xiàn)筆畫不連貫和多余詩句的情況——但模型對(duì)中文字形結(jié)構(gòu)的理解已達(dá)到驚人水平。能夠呈現(xiàn)具有書法美感的連貫筆畫,本身就標(biāo)志著技術(shù)的重要突破。
人物真實(shí)感方面,新模型實(shí)現(xiàn)了質(zhì)的飛躍。網(wǎng)友通過對(duì)比OpenAI首席執(zhí)行官山姆·奧特曼的自拍生成效果發(fā)現(xiàn),GPT-Image-2能精準(zhǔn)還原皮膚質(zhì)感、眼尾皺紋、胡須細(xì)節(jié)甚至發(fā)絲光影,而前代模型生成的圖像則顯得粗糙模糊。這種進(jìn)步使得AI生成的人物圖像幾乎達(dá)到以假亂真的程度。
隨著測試結(jié)果的持續(xù)流出,圖像生成領(lǐng)域的競爭格局正在發(fā)生微妙變化。谷歌此前憑借Nano Banana模型在真實(shí)感和文本渲染領(lǐng)域占據(jù)優(yōu)勢,但GPT-Image-2的橫空出世可能將重新定義行業(yè)標(biāo)準(zhǔn)。這場由技術(shù)突破引發(fā)的變革,正在悄然改寫AI圖像生成的未來走向。




















