滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

蘋果論文又炸場(chǎng)！Qwen3-Coder 被“特調(diào)”后，UI 生成能力竟超越了 GPT-5？

時(shí)間：2026-02-06 15:27:06 來源：CHINAZ編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

誰說“小模型”不能打敗“大巨人”？近日，蘋果UICoder團(tuán)隊(duì)發(fā)布了一篇震撼 AI 界的最新研究論文，展示了他們?nèi)绾瓮ㄟ^“魔改”開源模型，在特定領(lǐng)域?qū)崿F(xiàn)對(duì)頂尖大模型的逆襲。

這次，蘋果瞄準(zhǔn)的是所有開發(fā)者都頭疼的 UI（界面）開發(fā)。

目前 AI 生成代碼雖然厲害，但在 UI 設(shè)計(jì)上往往表現(xiàn)平平。原因很簡(jiǎn)單：傳統(tǒng)的“人類反饋強(qiáng)化學(xué)習(xí)”（RLHF）太粗糙了。以往 AI 學(xué)習(xí)設(shè)計(jì)，就像是在聽設(shè)計(jì)師說“這個(gè)界面不行”，但 AI 根本不知道哪里不行，也不知道怎么改。

為了調(diào)教出“審美在線”的 AI，蘋果請(qǐng)來了 21 位資深外援。

這些擁有 2 到 30 年經(jīng)驗(yàn)的設(shè)計(jì)大咖不再只是簡(jiǎn)單地打分，而是擼起袖子直接下場(chǎng)：寫評(píng)論、畫草圖、改代碼。蘋果團(tuán)隊(duì)收集了 1460 條這種帶有深度邏輯的專家注釋，并據(jù)此構(gòu)建了一個(gè)專門的獎(jiǎng)勵(lì)模型。

令人驚嘆的結(jié)果出現(xiàn)了：微調(diào)后的 Qwen3-Coder 戰(zhàn)勝了 GPT-5。

實(shí)驗(yàn)數(shù)據(jù)顯示，僅僅依靠 181 個(gè)高質(zhì)量的“草圖反饋”進(jìn)行微調(diào)，這個(gè)原本參數(shù)并不算巨量的模型，在生成 App 界面的能力上直接把GPT-5給超了。這再次印證了一個(gè)道理：在 AI 訓(xùn)練中，專家級(jí)的“少而精”反饋，遠(yuǎn)比海量的普通數(shù)據(jù)更具殺傷力。

研究還扎心地揭示了一個(gè)真相：審美真的主觀。

研究發(fā)現(xiàn)，普通人和專業(yè)設(shè)計(jì)師在判斷一個(gè)界面好不好看時(shí)，觀點(diǎn)一致率竟然只有 49.2%，跟拋硬幣沒區(qū)別。但一旦設(shè)計(jì)師通過“畫草圖”表達(dá)了具體修改意圖，一致率會(huì)瞬間飆升至 76.1%。這意味著，未來的 AI 設(shè)計(jì)工具不再是盲目猜測(cè)你的喜好，而是能真正聽懂你的視覺語言。

如果蘋果真的將這項(xiàng)技術(shù)植入 Xcode，或許“一句話生成精美 App”的時(shí)代真的不遠(yuǎn)了。

更多>同類資訊

李子柒治好了我的AI焦慮癥

02-22

AI時(shí)代的認(rèn)知裂谷與K型分化：你是那1%嗎？

02-22

6G核心技術(shù)突破：三星聯(lián)合KT完成7GHz頻段X-MIMO技術(shù)驗(yàn)證

02-22

奧爾特曼駁斥ChatGPT耗水相關(guān)謠言：完全不符合事實(shí)

02-22

數(shù)據(jù)顯示ChatGPT消費(fèi)版更多用于個(gè)人任務(wù)，較少用于工作

02-22

ChatGPT消費(fèi)版用途轉(zhuǎn)向：個(gè)人任務(wù)占比攀升，工作應(yīng)用漸少

02-22

宇樹科技王興興談機(jī)器人發(fā)展：技術(shù)進(jìn)步快，大規(guī)模應(yīng)用或需3至10年

對(duì)話中，對(duì)于“現(xiàn)在機(jī)器人發(fā)展的技術(shù)階段是否就如一個(gè)10歲的孩子甚至更小？”2月17日，宇樹科技創(chuàng)始人王興興發(fā)微博稱：“有朋友問春晚機(jī)器人進(jìn)化速度有多快，我想說這取決于大家對(duì)AI的想象力。此前，春晚《武B…

02-22

OpenAI CEO奧爾特曼：ChatGPT耗水謠言不實(shí)，能效或已追平人類

02-22

AI浪潮中上海老人緊跟步伐：智能設(shè)備助力，生活便捷又多彩

02-22

哈薩克斯坦宇通工廠：新春堅(jiān)守忙生產(chǎn) 新能源客車駛下線

02-22

李子柒：以經(jīng)歷為引，用非遺溫情治愈這個(gè)時(shí)代的AI焦慮

02-22

AI浪潮下的認(rèn)知分野：站在進(jìn)化岔路口，你選擇成為1%還是99%？

02-22

OpenAI CEO奧爾特曼回應(yīng)AI環(huán)境爭(zhēng)議：耗水謠言不實(shí) 能源擔(dān)憂應(yīng)聚焦總量

他還表示，人們擔(dān)憂人工智能的能源消耗總量是合理的 —— 并非單次提問的能耗，而是全球如今大規(guī)模使用人工智能帶來的總能耗。因此在他看來，公平的對(duì)比應(yīng)當(dāng)是：“在 ChatGPT 模型訓(xùn)練完成后，回答一個(gè)問題所…

02-22

OpenAI CEO奧爾特曼：ChatGPT耗水謠言不實(shí)，能源對(duì)比應(yīng)更公平

02-22

AI浪潮下的人類進(jìn)化抉擇：99%退化與1%躍遷的認(rèn)知分野

02-22

點(diǎn)擊查看更多 +

全站最新

特斯拉Cybertruck全輪驅(qū)動(dòng)版定價(jià)“限時(shí)十天” 馬斯克動(dòng)態(tài)調(diào)價(jià)引粉絲熱議

春晚機(jī)器人引爆消費(fèi)熱潮，中國(guó)智造加速邁進(jìn)“人手一臺(tái)”新時(shí)代

廣汽集團(tuán)戰(zhàn)略抉擇：聚焦埃安發(fā)展，能否開啟未來汽車市場(chǎng)新篇章？

磷酸鐵鋰與三元鋰：誰更適合家用？誰又能撐起高端電車市場(chǎng)？

穿越十萬公里的考驗(yàn)：現(xiàn)代Staria舒適與實(shí)用并存，優(yōu)缺點(diǎn)一目了然

雪鐵龍C3 Aircross與達(dá)契亞Duster對(duì)比：誰才是省錢實(shí)用之選？

熱門內(nèi)容

本欄最新

中國(guó)芯片實(shí)力獲認(rèn)可：豐田鈴木等外企選用，成本品質(zhì)雙重優(yōu)勢(shì)凸顯

黃仁勛預(yù)熱GTC 2026：將推“世界前所未見”芯片突破技術(shù)極限引期待

黃仁勛預(yù)熱GTC 2026：將推“世界未見”芯片突破技術(shù)極限引期待

黃仁勛預(yù)熱GTC 2026：將推“世界前所未見”芯片突破技術(shù)極限再領(lǐng)跑

黃仁勛預(yù)熱GTC 2026：全新芯片將至英偉達(dá)突破極限再領(lǐng)跑AI算力

從對(duì)話到實(shí)干：豆包大模型2.0化身全能助手，多領(lǐng)域展現(xiàn)驚人動(dòng)手能力

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

蘋果論文又炸場(chǎng)！Qwen3-Coder 被“特調(diào)”后，UI 生成能力竟超越了 GPT-5？