隨著 Anthropic 正式發(fā)布 Opus 4.6 模型,一場(chǎng)關(guān)于 AI 自主編程能力的硬核實(shí)驗(yàn)引發(fā)了科技圈的熱議。Anthropic 安全團(tuán)隊(duì)研究員 Nicholas Carlini 近日透露,他利用 16 個(gè) Claude 智能體(Agents)組建了一個(gè)“特工團(tuán)隊(duì)”,在幾乎沒有人工干預(yù)的情況下,從零開始編寫出了一個(gè)基于 Rust 語言的 C 編譯器。
這場(chǎng)實(shí)驗(yàn)堪稱“昂貴”。在為期兩周的開發(fā)周期內(nèi),這些 AI 智能體經(jīng)歷了近 2000 次代碼會(huì)話,消耗了約 20 億個(gè)輸入 Token,最終產(chǎn)生的 API 費(fèi)用高達(dá) 2 萬美元(約合 14.4 萬人民幣)。然而,投入換來了驚人的產(chǎn)出:這支 AI 團(tuán)隊(duì)自主生成了超過 10 萬行代碼,且該編譯器成功實(shí)現(xiàn)了在 x86、ARM 和 RISC-V 架構(gòu)上編譯 Linux 6.9 內(nèi)核。
盡管成果斐然,Carlini 卻表達(dá)了“興奮與不安并存”的復(fù)雜心情。他發(fā)現(xiàn),雖然 AI 可以通過循環(huán)指令實(shí)現(xiàn) 24 小時(shí)無間斷工作,自主解決“下一個(gè)最顯而易見”的問題,但其生成的代碼質(zhì)量仍不及頂尖人類程序員,且在缺乏引導(dǎo)時(shí)容易陷入無效測(cè)試的死循環(huán)。更有觀察者在 GitHub 上調(diào)侃,這種從海量訓(xùn)練數(shù)據(jù)中“拼湊”出的代碼并非真正意義上的從零創(chuàng)作。這場(chǎng)實(shí)驗(yàn)不僅展示了智能體團(tuán)隊(duì)協(xié)作處理復(fù)雜項(xiàng)目的潛力,也讓開發(fā)者們開始審視軟件自動(dòng)化生產(chǎn)背后的安全與驗(yàn)證風(fēng)險(xiǎn)。











