2月6日消息,美國時間2月5日上午,Anthropic與OpenAI相隔不到10分鐘先后發(fā)布了新一代旗艦?zāi)P汀狢laude Opus 4.6和GPT-5.3-Codex。
上午10點(diǎn)剛過,Anthropic率先扔出Claude Opus 4.6。官方的定義是“更聰明的模型”,強(qiáng)調(diào)其“規(guī)劃更謹(jǐn)慎、能更長時間持續(xù)執(zhí)行代理式任務(wù)”。
幾乎就在同一時間,Sam Altman在X平臺上簡短而有力地宣布了GPT-5.3-Codex的登場。
兩家公司就像約好了一樣,在同一天同一時刻拋出了自己的重磅產(chǎn)品。這場“模型遭遇戰(zhàn)”背后,是兩大巨頭對于AI智能體技術(shù)路線的明確宣示。
GPT-5.3-Codex VS Claude Opus 4.6
基于官方信息,我們先看看兩款模型的定位與能力畫像。
1、GPT-5.3-Codex:從編碼助手到全能數(shù)字協(xié)作者
核心定位:
官方定義為“迄今為止能力最強(qiáng)的智能體編碼模型”,其目標(biāo)是成為一個能完成開發(fā)者和專業(yè)人士在計算機(jī)上幾乎所有工作的智能體。
關(guān)鍵能力包括:
自我進(jìn)化:首個在自身創(chuàng)建過程中發(fā)揮關(guān)鍵作用的模型,早期版本被用于調(diào)試自身訓(xùn)練、管理部署和診斷評估結(jié)果。
網(wǎng)絡(luò)安全:被OpenAI自身歸類為網(wǎng)絡(luò)安全任務(wù)“高能力”模型,并首次直接訓(xùn)練以識別軟件漏洞。為此,OpenAI配套推出了“可信網(wǎng)絡(luò)訪問”試點(diǎn)計劃和1000萬美元的API贈款計劃。
交互性:在工作時提供頻繁更新,允許用戶實(shí)時提問、討論方案并引導(dǎo)方向,如同協(xié)作的同事。
2. Claude Opus 4.6:深思熟慮的專業(yè)知識工作者
核心定位:在保持頂級安全性的前提下,于專業(yè)領(lǐng)域推理、長上下文處理及復(fù)雜任務(wù)規(guī)劃上實(shí)現(xiàn)突破。
關(guān)鍵能力包括:
超長上下文:首次為Opus級模型推出100萬token的上下文窗口(測試版)。在“大海撈針”測試中,其信息召回率從上一代的18.5%躍升至76%,實(shí)現(xiàn)了質(zhì)的提升。
可控的智能:新增“effort”(努力)控制參數(shù)(低、中、高、最高),讓開發(fā)者能在成本、速度和質(zhì)量間取得平衡;并引入“自適應(yīng)思考” 功能,讓模型能根據(jù)任務(wù)難度自行調(diào)整思考深度。
專業(yè)領(lǐng)域卓越:在衡量金融、法律等領(lǐng)域知識工作的GDPval-AA評估中,其Elo評分比業(yè)內(nèi)第二的模型(GPT-5.2)高出約144分。
以下表格整合了官方數(shù)據(jù),直觀展示二者的性能特征:
簡單來說,如果你的工作像一名需要沖鋒陷陣、在終端和各類工具中穿梭的“特種兵”,GPT-5.3-Codex 的交互性和執(zhí)行力更強(qiáng)。
如果你的任務(wù)更像是一位需要審慎研究、處理海量資料并做出專業(yè)決策的“分析師”或“架構(gòu)師”,Claude Opus 4.6 的深度和可靠性更優(yōu)。
OpenAI和Anthropic路線分道揚(yáng)鑣?
雖然各有側(cè)重,但兩款模型的升級,共同指向并加速了同一個未來:AI智能體(Agent)的普及化。但它們選擇從不同路徑切入。
GPT-5.3-Codex將智能體的能力從“寫代碼”擴(kuò)展到“運(yùn)行并維護(hù)整個軟件生命周期”,這意味著未來軟件項(xiàng)目的開發(fā)、調(diào)試、部署、監(jiān)控可能由AI智能體串聯(lián)完成。Claude Opus 4.6則能自主管理大型代碼庫遷移、分配任務(wù),扮演“技術(shù)主管”角色。
兩者都深度融合了辦公套件。Claude已推出Excel增強(qiáng)版和PowerPoint研究預(yù)覽;GPT-5.3-Codex可根據(jù)模糊指令生成功能完備的網(wǎng)站和演示文稿。這標(biāo)志著AI開始理解工作流背后的業(yè)務(wù)意圖,而不僅僅是執(zhí)行單一指令。
值得注意的是,兩者均在網(wǎng)絡(luò)安全能力上大幅提升,迫使行業(yè)進(jìn)入新階段。OpenAI配套推出了防御性工具和贈款計劃,Anthropic也強(qiáng)調(diào)用AI幫助修補(bǔ)漏洞。這預(yù)示著AI將成為攻防兩端的關(guān)鍵工具,生態(tài)建設(shè)(如為開源項(xiàng)目提供免費(fèi)安全掃描)變得至關(guān)重要。
另一個值得關(guān)注的趨勢是,GPT-5.3-Codex“自我用于開發(fā)”的實(shí)踐具有里程碑意義,模型開發(fā)進(jìn)入“自舉”新階段。這不僅是效率提升,更可能開啟AI自我迭代優(yōu)化的新范式,進(jìn)一步加速技術(shù)進(jìn)化速度。
此次發(fā)布并非簡單的功能迭代,而是兩大巨頭關(guān)于AI未來形態(tài)的一次路線展示。
OpenAI的路線是“擴(kuò)張與融合”,讓Codex成為一個能操作計算機(jī)、打通所有數(shù)字任務(wù)的通用智能體底座,追求能力的廣度與交互的自然度。
Anthropic的路線是“深化與可控”,在確保安全與可靠的前提下,將模型打造為在特定專業(yè)領(lǐng)域(金融、法律、編碼)具有頂級深度分析能力的“專家”,并賦予開發(fā)者精細(xì)的控制權(quán)。
無論哪條路線,我們都在見證一個根本性轉(zhuǎn)變:AI正從一個需要被“提示”的工具,轉(zhuǎn)變?yōu)橐粋€可以自主規(guī)劃、執(zhí)行復(fù)雜任務(wù)、并能與人實(shí)時協(xié)作的智能體。這不僅僅會改變開發(fā)者和知識工作者的工作方式,最終將重新定義軟件、服務(wù)乃至整個數(shù)字生態(tài)的構(gòu)建方式。
而競爭的下一個前沿,將是這些智能體如何被安全、高效、大規(guī)模地集成到真實(shí)世界的業(yè)務(wù)流程中。











