滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

AI編程大戰(zhàn)打響！OpenAI推出GPT-5.3-Codex，與Anthropic同步發(fā)布新模型

時(shí)間：2026-02-06 08:13:25 來源：華爾街見聞編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

OpenAI周四發(fā)布GPT-5.3-Codex。該公司稱，這是迄今為止能力最強(qiáng)的編程代理。值得注意的是，此次發(fā)布的時(shí)間點(diǎn)被精準(zhǔn)安排在Anthropic推出其旗艦?zāi)Ｐ蜕?jí)版Claude Opus 4.6的同一時(shí)刻。媒體稱，兩大模型同步亮相，被業(yè)內(nèi)觀察人士視為“AI編程大戰(zhàn)”的第一槍——這是一場圍繞企業(yè)級(jí)軟件開發(fā)市場展開的高風(fēng)險(xiǎn)爭奪戰(zhàn)。

OpenAI首席執(zhí)行官Sam Altman在模型發(fā)布幾分鐘后就在X上寫道：

“我非常喜歡用這個(gè)模型來開發(fā)，它帶來的進(jìn)步感受，遠(yuǎn)遠(yuǎn)超過基準(zhǔn)測試所顯示的幅度。”

“看著我們用5.3-Codex來開發(fā)5.3-Codex，從而把發(fā)布速度提升到這么快，真的令人震撼，這毫無疑問預(yù)示著未來的發(fā)展方向?！?/p>

媒體表示，模型本身參與了自身的構(gòu)建，被視為AI發(fā)展中的一個(gè)重要里程碑。根據(jù)OpenAI的公告，Codex團(tuán)隊(duì)使用GPT-5.3-Codex的早期版本來調(diào)試自身的訓(xùn)練過程、管理部署基礎(chǔ)設(shè)施，并診斷測試結(jié)果和評(píng)估情況。OpenAI將其稱為“我們首個(gè)在自身創(chuàng)建過程中發(fā)揮關(guān)鍵作用的模型”。

GPT-5.3-Codex多項(xiàng)基準(zhǔn)成績領(lǐng)先Claude達(dá)到兩位數(shù)

OpenAI表示，新模型在多項(xiàng)行業(yè)基準(zhǔn)測試中實(shí)現(xiàn)了顯著提升。GPT-5.3-Codex在SWE-Bench Pro上取得了57%的成績。SWE-Bench Pro是一項(xiàng)極為嚴(yán)格的真實(shí)世界軟件工程評(píng)測，涵蓋四種編程語言，重點(diǎn)考察抗數(shù)據(jù)污染、具有工業(yè)相關(guān)性的挑戰(zhàn)。

該模型在Terminal-Bench 2.0上得分77.3%，這一基準(zhǔn)主要衡量編程代理所必需的終端操作能力；在OSWorld上得分64%，該測試要求模型在可視化桌面環(huán)境中完成生產(chǎn)力任務(wù)，是一項(xiàng)強(qiáng)調(diào)“代理式”計(jì)算機(jī)使用能力的評(píng)估。

其中，Terminal-Bench 2.0的結(jié)果尤為引人注目。根據(jù)周三公布的性能數(shù)據(jù)，GPT-5.3-Codex的得分為77.3%，而GPT-5.2-Codex為64.0%，基礎(chǔ)版GPT-5.2模型為62.2%。也就是說，僅一代升級(jí)，成績就提升了13個(gè)百分點(diǎn)。一位X平臺(tái)用戶指出，這一成績“徹底碾壓”了Anthropic的Opus 4.6，后者據(jù)稱在同一基準(zhǔn)上的得分為65.4%。

OpenAI還表示，新模型是在效率大幅提升的情況下實(shí)現(xiàn)上述成績的：在完成同等任務(wù)時(shí)，所需token數(shù)量不到上一代模型的一半，同時(shí)單個(gè)token的推理速度提升超過25%。

OpenAI在公告中稱：

“值得注意的是，GPT-5.3-Codex在使用的token數(shù)量上低于任何此前模型，這讓用戶能夠做更多事情?！?/p>

從編程助手到編程操作者

相比基準(zhǔn)測試的提升，更重要的是OpenAI對(duì)GPT-5.3-Codex的定位。該公司明確表示：

“Codex正從一個(gè)只能編寫和審查代碼的代理，進(jìn)化為一個(gè)幾乎可以完成開發(fā)者和專業(yè)人士在電腦上所做任何事情的代理?！?/p>

這一能力擴(kuò)展涵蓋了調(diào)試、部署、監(jiān)控、撰寫產(chǎn)品需求文檔、編輯文案、開展用戶研究、制作演示文稿，以及在電子表格應(yīng)用中分析數(shù)據(jù)等。該模型在GDPVal評(píng)估中表現(xiàn)突出。GDPVal是OpenAI于2025年發(fā)布的一項(xiàng)評(píng)估，用于衡量模型在44種職業(yè)中、對(duì)定義明確的知識(shí)型工作任務(wù)的完成能力。

分析認(rèn)為，這一擴(kuò)展信號(hào)表明，OpenAI的目標(biāo)不僅是開發(fā)者工具市場，還包括更廣泛的企業(yè)生產(chǎn)力軟件領(lǐng)域。該市場的既有玩家包括Microsoft、Salesforce和ServiceNow，這些公司都在加速將AI代理嵌入自身平臺(tái)。

OpenAI首個(gè)“高能力”網(wǎng)絡(luò)安全模型

向通用計(jì)算能力的轉(zhuǎn)變，也帶來了新的安全考量。OpenAI表示，GPT-5.3-Codex是其首個(gè)在“準(zhǔn)備度框架”下，被歸類為在網(wǎng)絡(luò)安全相關(guān)任務(wù)上具備“高能力”的模型，同時(shí)也是首個(gè)被直接訓(xùn)練用于識(shí)別軟件漏洞的模型。

OpenAI表示：“盡管我們尚未發(fā)現(xiàn)它可以端到端自動(dòng)化網(wǎng)絡(luò)攻擊的確鑿證據(jù)，但我們采取了審慎策略，部署了迄今為止最全面的網(wǎng)絡(luò)安全防護(hù)體系?！毕嚓P(guān)措施包括雙用途安全訓(xùn)練、自動(dòng)化監(jiān)控、對(duì)高級(jí)能力實(shí)行可信訪問機(jī)制，以及結(jié)合威脅情報(bào)的執(zhí)行管線。

Altman也在X上強(qiáng)調(diào)了這一進(jìn)展：

“這是我們首個(gè)在準(zhǔn)備度框架中，網(wǎng)絡(luò)安全能力達(dá)到‘高’級(jí)別的模型。我們正在試點(diǎn)可信訪問框架，并承諾投入1000萬美元的API額度，用于加速網(wǎng)絡(luò)防御?！?/p>

OpenAI還在擴(kuò)大其安全研究代理Aardvark的私有測試，并與開源維護(hù)者合作，為廣泛使用的項(xiàng)目提供免費(fèi)的代碼庫掃描。OpenAI以Next.js為例，稱一名安全研究人員上周就曾使用Codex發(fā)現(xiàn)并披露了相關(guān)漏洞。

同日同時(shí)發(fā)布最新模型，OpenAI與Anthropic的競爭白熱化

不過，該公司網(wǎng)絡(luò)安全方面的宣布，很快被OpenAI與Anthropic之間的對(duì)抗所掩蓋。媒體表示，若脫離背景，很難理解周四這一發(fā)布時(shí)間點(diǎn)的意義。

Anthropic是一家以AI安全為核心的初創(chuàng)公司，成立于2021年，由多名前OpenAI研究人員創(chuàng)辦，其中包括Dario Amodei和Daniela Amodei。

兩家公司都將重大產(chǎn)品發(fā)布安排在當(dāng)天美西時(shí)間上午10點(diǎn)。Anthropic發(fā)布了Claude Opus 4.6，并將其描述為“最聰明的模型”，稱其“規(guī)劃更謹(jǐn)慎、能更長時(shí)間持續(xù)執(zhí)行代理式任務(wù)、在超大型代碼庫中運(yùn)行可靠，并且能夠發(fā)現(xiàn)并糾正自身錯(cuò)誤”。

而這一正面交鋒的背后，是一周不斷升級(jí)的緊張關(guān)系。Anthropic宣布，將在超級(jí)碗期間播出廣告，嘲諷OpenAI近期開始在ChatGPT免費(fèi)用戶中測試廣告的決定。

Altman隨后作出罕見的直接回應(yīng)，在一篇長篇X帖中稱這些廣告“好笑”，但“明顯不誠實(shí)”。

Altman寫道：

“我們顯然永遠(yuǎn)不會(huì)像Anthropic廣告中描繪的那樣投放廣告。我們并不愚蠢，也知道用戶絕不會(huì)接受那種做法?！?/p>

“我想這倒是很符合Anthropic一貫的‘雙重話術(shù)’風(fēng)格，用一個(gè)具有誤導(dǎo)性的廣告，去批評(píng)根本不存在的、理論上的誤導(dǎo)性廣告，但超級(jí)碗廣告并不是我預(yù)期會(huì)看到這種事情的地方?！?/p>

他進(jìn)一步將Anthropic形容為一家“威權(quán)式公司”，稱其“想要控制人們?nèi)绾问褂肁I”。

Altman寫道：

“Anthropic向富人提供昂貴的產(chǎn)品。使用ChatGPT免費(fèi)版的德州人數(shù)量，比美國使用Claude的總?cè)藬?shù)還要多，所以我們面臨的是完全不同形態(tài)的問題?！?/p>

企業(yè)AI支出遠(yuǎn)超預(yù)期，OpenAI市場份額面臨Anthropic與谷歌擠壓

公開的口水戰(zhàn)背后，是一場極其嚴(yán)肅的商業(yè)競爭。這一對(duì)抗發(fā)生在企業(yè)級(jí)AI應(yīng)用爆發(fā)式增長的大背景下，雙方都在爭奪一個(gè)迅速擴(kuò)張的市場。

根據(jù)Andreessen Horowitz本周發(fā)布的調(diào)查數(shù)據(jù)，企業(yè)在大語言模型上的支出，已經(jīng)大幅超過此前即便相當(dāng)樂觀的預(yù)測。2025年，企業(yè)平均在LLM上的支出達(dá)到700萬美元，較2024年實(shí)際支出的250萬美元高出180%，也比企業(yè)在一年前對(duì)2025年的預(yù)測高出56%。預(yù)計(jì)到2026年，單個(gè)企業(yè)的支出將達(dá)到1160萬美元，再增長65%。

a16z的數(shù)據(jù)還揭示了市場格局的變化。OpenAI仍然占據(jù)企業(yè)AI支出中最大的份額，但這一份額正在縮小——從2024年的62%，下降至預(yù)計(jì)2026年的53%。同期，Anthropic的份額從14%上升至預(yù)計(jì)18%，Google也呈現(xiàn)出類似的增長趨勢(shì)。

在企業(yè)使用模式上，情況更加微妙。雖然OpenAI在總體使用量上領(lǐng)先，但在接受調(diào)查的OpenAI客戶中，只有46%在生產(chǎn)環(huán)境中使用其最強(qiáng)模型；而Anthropic和Google這一比例分別為75%和76%。如果將測試環(huán)境也計(jì)算在內(nèi)，89%的Anthropic客戶正在測試或使用其最強(qiáng)模型，這一比例在主要廠商中最高。

在軟件開發(fā)這一雙方編程代理的核心應(yīng)用場景中，a16z調(diào)查顯示，OpenAI的市場份額約為35%，而Anthropic則占據(jù)了剩余市場中相當(dāng)可觀、且持續(xù)增長的一部分。

OpenAI承諾未來數(shù)周推出更多Codex功能

展望未來，OpenAI表示，GPT-5.3-Codex已立即向付費(fèi)ChatGPT用戶開放，覆蓋所有Codex使用場景，包括桌面應(yīng)用、命令行接口、IDE擴(kuò)展和網(wǎng)頁端，API接口預(yù)計(jì)隨后推出。

該模型還加入了一項(xiàng)新的交互功能：用戶可以在“務(wù)實(shí)型”和“友好型”兩種性格之間進(jìn)行選擇。Altman表示，用戶對(duì)這一點(diǎn)有著強(qiáng)烈偏好。在更實(shí)質(zhì)性的層面上，模型在執(zhí)行任務(wù)過程中會(huì)頻繁提供進(jìn)度更新，允許用戶實(shí)時(shí)互動(dòng)、提問、討論思路，并在不丟失上下文的情況下引導(dǎo)解決方案。

OpenAI表示：

“你不再需要等待最終結(jié)果，而是可以實(shí)時(shí)互動(dòng)。GPT-5.3-Codex會(huì)講清楚它正在做什么，響應(yīng)反饋，并從頭到尾讓你保持知情。”

公司承諾，未來幾周還將推出更多能力。Altman直言：“我相信Codex會(huì)贏?！?/p>

他在回應(yīng)Anthropic時(shí)，用一句頗具哲學(xué)意味的話為這場競爭定調(diào)：

“這個(gè)時(shí)代，屬于建設(shè)者，而不屬于那些想要控制他們的人?！?/p>

02-17

從單兵到集群，從生成到創(chuàng)作：北京AI以創(chuàng)新突破引領(lǐng)全球新潮流

02-17

阿里開源千問Qwen3.5-Plus大模型：性能卓越成本低，多領(lǐng)域表現(xiàn)亮眼

02-17

賽博科技遇上傳統(tǒng)年俗：機(jī)器人運(yùn)維工程師守護(hù)別樣年味

02-17

春晚機(jī)器人成焦點(diǎn)！從舞臺(tái)驚艷到賣爆，總導(dǎo)演揭秘背后深意

02-17

蘋果3月4日將辦特別活動(dòng) 傳低價(jià)MacBook等多款新品或全球同步登場

02-17

特斯拉FSD購買方式生變：永久購買選項(xiàng)取消訂閱模式成唯一選擇

02-17

烏干達(dá)時(shí)薪1.16美元的數(shù)據(jù)標(biāo)注員：高壓之下為AI“投喂”的隱形勞動(dòng)者

從在惡劣工作環(huán)境中掙扎、缺乏基本勞動(dòng)保障的低收入且工作不穩(wěn)定的數(shù)據(jù)標(biāo)注員，到在全球頂尖科技公司總部享受高薪待遇的機(jī)器學(xué)習(xí)工程師，這些工作者站在技術(shù)變革的前沿，但AI驅(qū)動(dòng)的監(jiān)控和生產(chǎn)力工具正席卷各行各業(yè)，即使…

02-17

春晚機(jī)器人“霸屏”引熱議，市場搶購熱潮起，中國智造加速走進(jìn)百姓家

面對(duì)2026年春晚舞臺(tái)上機(jī)器人節(jié)目占比顯著提升的熱議，于蕾正式回應(yīng)稱，團(tuán)隊(duì)旨在通過多維舞臺(tái)呈現(xiàn)，展現(xiàn)中國機(jī)器人產(chǎn)業(yè)的技術(shù)突破與文化融合。這場由春晚引發(fā)的機(jī)器人熱潮，不只是一場炫酷的科技秀，更是一次對(duì)中國智造…

02-17

春晚機(jī)器人成焦點(diǎn)：搜索訂單激增，總導(dǎo)演揭秘背后產(chǎn)業(yè)愿景

昨天的春晚，多個(gè)關(guān)于機(jī)器人的話題沖上熱搜。在除夕當(dāng)晚10點(diǎn)，京東也上架了包括“春晚同款”機(jī)器人在內(nèi)的多款機(jī)器人。在活動(dòng)上線幾分鐘內(nèi)，包括魔法原子、宇樹科技、松延動(dòng)力等品牌的機(jī)器人即被搶購一空。春晚總導(dǎo)演…

02-17

春節(jié)AI購物熱潮涌動(dòng)：1.3億人嘗鮮，電影票訂單激增372倍

一個(gè)用戶需求的背后，千問可以調(diào)度整個(gè)阿里生態(tài)為用戶服務(wù)——阿里生態(tài)體系的淘寶、支付寶、淘寶閃購、飛豬、高德、大麥都已接入千問，未來還將上線AI打車、充值手機(jī)話費(fèi)、高德掃街榜團(tuán)購等功能。 QuestMobil…

02-17

春晚“帶貨”實(shí)力強(qiáng)勁京東機(jī)器人搜索訂單量雙雙大漲

02-17

不做人形不卷通用，蘇亮以“工位型機(jī)器人”在商業(yè)場景中逐夢(mèng)前行

02-17

宇樹科技領(lǐng)銜！春晚機(jī)器人集體“炫技” 具身智能產(chǎn)業(yè)迎新篇

02-17

松延動(dòng)力攜多款人形機(jī)器人亮相春晚解鎖技術(shù)突破開啟商業(yè)化新篇

02-17

點(diǎn)擊查看更多 +

全站最新

豆包除夕AI互動(dòng)19億次 Seedance2.0為春晚提供技術(shù)支持

"問界山河"點(diǎn)亮除夕夜！問界M9春晚《手到福來》掀起全網(wǎng)參與熱潮

烏干達(dá)時(shí)薪1.16美元的數(shù)據(jù)標(biāo)注員：高壓之下為AI“投喂”的隱形勞動(dòng)者

春晚機(jī)器人“霸屏”引熱議，市場搶購熱潮起，中國智造加速走進(jìn)百姓家

春晚機(jī)器人成焦點(diǎn)：搜索訂單激增，總導(dǎo)演揭秘背后產(chǎn)業(yè)愿景

春節(jié)AI購物熱潮涌動(dòng)：1.3億人嘗鮮，電影票訂單激增372倍

熱門內(nèi)容

本欄最新

烏干達(dá)時(shí)薪1.16美元的數(shù)據(jù)標(biāo)注員：高壓之下為AI“投喂”的隱形勞動(dòng)者

春晚機(jī)器人“霸屏”引熱議，市場搶購熱潮起，中國智造加速走進(jìn)百姓家

春晚機(jī)器人成焦點(diǎn)：搜索訂單激增，總導(dǎo)演揭秘背后產(chǎn)業(yè)愿景

春節(jié)AI購物熱潮涌動(dòng)：1.3億人嘗鮮，電影票訂單激增372倍

馬斯克三次確認(rèn)：特斯拉Cybercab 4月投產(chǎn) 開啟自動(dòng)駕駛網(wǎng)約車新篇

馬斯克三度確認(rèn)：特斯拉Cybercab四月投產(chǎn)，自動(dòng)駕駛網(wǎng)約車核心登場

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AI編程大戰(zhàn)打響！OpenAI推出GPT-5.3-Codex，與Anthropic同步發(fā)布新模型

AI編程大戰(zhàn)打響！OpenAI推出GPT-5.3-Codex，與Anthropic同步發(fā)布新模型