在近期一期備受關(guān)注的Dev Interrupted播客中,OpenAI Codex工程負(fù)責(zé)人Thibault Sottiaux深入剖析了Codex團(tuán)隊(duì)構(gòu)建自主編程智能體的獨(dú)特方法論。他拋出一個(gè)引人深思的觀點(diǎn):復(fù)雜的腳手架并非能力的擴(kuò)展,而更像是對(duì)問題的掩蓋。這一觀點(diǎn)為當(dāng)前智能體開發(fā)領(lǐng)域提供了全新的思考視角。
值得關(guān)注的是,播客發(fā)布不到三周,OpenClaw創(chuàng)始人Peter Steinberger便宣布加入OpenAI,負(fù)責(zé)下一代個(gè)人智能體項(xiàng)目。Steinberger此前公開表示自己是“Codex最大的免費(fèi)廣告”,他借助Codex構(gòu)建了整個(gè)OpenClaw,使生產(chǎn)力大幅提升。盡管他承認(rèn)Claude Opus是“最好的通用智能體”,但最終還是選擇了OpenAI。這一選擇背后,與Sottiaux在播客中闡述的理念高度契合,即真正的競爭力在于模型能力和垂直整合,而非外部堆砌的工程手段。
Sottiaux在播客中強(qiáng)調(diào),Codex首先是一個(gè)通用智能體,產(chǎn)品界面是后續(xù)才考慮的要素。先專注于提升智能體的能力,再探索其應(yīng)用場景,這種思路帶來了意想不到的效果。社區(qū)中每周都有公司基于Codex的開源版本構(gòu)建業(yè)務(wù),且應(yīng)用領(lǐng)域廣泛,不僅限于編程,還涉及電子表格編輯、瀏覽器自動(dòng)化等非編程領(lǐng)域。這充分證明了智能體的通用性,其產(chǎn)品形態(tài)具有極大的可變性。
對(duì)于軟件工程師而言,真正的瓶頸并非代碼生成,而是日常工作中的規(guī)劃、溝通、代碼審查以及理解系統(tǒng)狀態(tài)等環(huán)節(jié)。當(dāng)代碼生成速度大幅提升后,這些環(huán)節(jié)的問題便凸顯出來,成為制約整體效率的關(guān)鍵因素。
Codex團(tuán)隊(duì)處于一個(gè)獨(dú)特的位置,基礎(chǔ)模型、智能體框架和面向用戶的產(chǎn)品都在同一組織內(nèi)部。這種垂直整合帶來了諸多優(yōu)勢。一方面,研究和工程形成雙向飛輪,工程實(shí)踐中的問題會(huì)影響研究方向,研究突破又會(huì)重塑工程路線圖,兩者相互促進(jìn)。另一方面,團(tuán)隊(duì)可以選擇在合適的層級(jí)解決問題。有些問題無需在框架中打補(bǔ)丁,直接在下一版模型訓(xùn)練中解決效果更佳。Codex團(tuán)隊(duì)還能在小、中、前沿模型上測試同一套系統(tǒng)的表現(xiàn),驗(yàn)證整個(gè)系統(tǒng)是否符合預(yù)期的擴(kuò)展曲線,將擴(kuò)展定律從模型層面延伸到完整系統(tǒng)層面。
Sottiaux引用No Free Lunch定理指出,試圖在所有分布上都表現(xiàn)智能,必然不如為特定分布專門優(yōu)化。Codex的harness和model耦合訓(xùn)練和部署,正是針對(duì)特定分布進(jìn)行優(yōu)化,從而獲得了單獨(dú)優(yōu)化任何一方都無法達(dá)到的能力提升。對(duì)于沒有垂直整合條件的團(tuán)隊(duì),Sottiaux認(rèn)為,若想保持對(duì)所有基礎(chǔ)模型的完全無關(guān)性,就只能基于這些模型的公共子集構(gòu)建,性能必然會(huì)受到影響。他預(yù)計(jì)主流玩家最終只會(huì)為少數(shù)幾個(gè)模型做深度適配。
在播客中,Sottiaux著重強(qiáng)調(diào)了腳手架的問題。他指出,腳手架本應(yīng)是臨時(shí)支撐,隨著模型能力增強(qiáng)應(yīng)逐步拆除,模型應(yīng)能獨(dú)立站立。然而,許多團(tuán)隊(duì)卻將腳手架當(dāng)作噴氣背包,不斷往里添加工具、邏輯和規(guī)則,導(dǎo)致系統(tǒng)越來越復(fù)雜。這帶來了能力懸崖的風(fēng)險(xiǎn),即框架中引入過多偏見和約束,當(dāng)模型能力提升時(shí),反而無法充分發(fā)揮新能力。而垂直整合的優(yōu)勢在于,Codex團(tuán)隊(duì)只需關(guān)注自身模型系列,每次改進(jìn)都能移除部分腳手架,不用擔(dān)心破壞外部因素。
Codex開源并非簡單的社區(qū)建設(shè),背后有著深層次的考量。一是破除智能體的神秘感,展示通過做好幾個(gè)原語就能從模型中榨取驚人性能。二是理解開源世界將如何被改變,Codex團(tuán)隊(duì)認(rèn)為AI解決代碼生成問題后,開源的運(yùn)作方式會(huì)發(fā)生根本性變化,他們想通過參與開源提前了解這種變化。三是借助社區(qū)創(chuàng)造力發(fā)現(xiàn)新用法,目前倉庫有超過一千個(gè)fork,團(tuán)隊(duì)與fork作者合作,將好的改動(dòng)移植回主倉庫。
在從Type遷移到Rust的過程中,Codex團(tuán)隊(duì)面臨了社區(qū)關(guān)系中的艱難時(shí)刻。由于遷移意味著重寫代碼庫,此前接受了大量PR的團(tuán)隊(duì)面臨著巨大挑戰(zhàn)。但團(tuán)隊(duì)堅(jiān)信未來會(huì)有大量智能體并發(fā)運(yùn)行,需要高效語言,最終完成了遷移。遷移后,社區(qū)關(guān)系重新建立,一批優(yōu)秀的Rust貢獻(xiàn)者加入了核心開發(fā)。
回顧過去,Codex團(tuán)隊(duì)在2025年面臨的最大痛點(diǎn)是上下文壓縮。當(dāng)智能體工作超出模型上下文窗口后,需要摘要已完成工作、重置上下文繼續(xù),這會(huì)導(dǎo)致模型丟失大量工作上下文。用提示詞和框架層的啟發(fā)式方法解決效果不佳,最終團(tuán)隊(duì)決定在模型訓(xùn)練層面端到端解決,現(xiàn)在智能體可以跨越20個(gè)上下文窗口持續(xù)工作,相關(guān)投訴幾乎為零。
展望2026年,Codex團(tuán)隊(duì)有三個(gè)主要方向。一是多智能體網(wǎng)絡(luò),單智能體可靠后,今年將實(shí)現(xiàn)多智能體協(xié)作,產(chǎn)出量有望提升一到兩個(gè)數(shù)量級(jí),但同時(shí)也會(huì)面臨token消耗和代碼審查增加的問題。二是速度,預(yù)計(jì)模型今年將顯著加速,達(dá)到智能水平與響應(yīng)速度的平衡點(diǎn),提升產(chǎn)品體驗(yàn)。三是協(xié)作型人格,Codex目前的交互風(fēng)格被用戶評(píng)價(jià)為“固執(zhí)的直男工程師”,團(tuán)隊(duì)希望模型在協(xié)作中能給予情感確認(rèn),根據(jù)不同場景調(diào)整交互風(fēng)格。
隨著智能體的發(fā)展,開發(fā)者角色也在發(fā)生重塑。代碼審查成為關(guān)鍵瓶頸,Codex團(tuán)隊(duì)構(gòu)建的代碼審查模型在OpenAI內(nèi)部得到廣泛應(yīng)用,捕獲了大量bug。智能體加速了人與人之間的協(xié)作,團(tuán)隊(duì)面對(duì)面交流時(shí)間增加,創(chuàng)意討論和規(guī)劃更多。同時(shí),記錄意圖變得至關(guān)重要,團(tuán)隊(duì)開始構(gòu)建工具追蹤組織層面的變更。大型spec存在局限性,有時(shí)plan只需列出幾件要做的事來驗(yàn)證方向。工程師的職業(yè)路徑向TLM(Tech Lead Manager)演進(jìn),核心技能更像技術(shù)負(fù)責(zé)人加產(chǎn)品經(jīng)理的混合體。新人在團(tuán)隊(duì)中也展現(xiàn)出獨(dú)特優(yōu)勢,他們沒有傳統(tǒng)編程習(xí)慣的束縛,對(duì)新工具和新方式接受度高,能快速提高團(tuán)隊(duì)生產(chǎn)力。
Sottiaux最后給出了關(guān)于Skills的建議。這是一個(gè)開放標(biāo)準(zhǔn),用戶可以教模型用自己認(rèn)為最有效的方式執(zhí)行特定任務(wù)。他自己有一個(gè)QA skill,讓Codex在終端里測試新功能。他比喻給智能體添加Skills就像訓(xùn)練寶可夢,每次交互它都在升級(jí),逐漸建立信任關(guān)系。關(guān)鍵在于不要只自動(dòng)化代碼生成,要思考日常工作中不想做但必須做的環(huán)節(jié),將這些交給智能體,保留編程中令人愉悅的部分,讓智能體成為專屬于自己工作流的搭檔。











