科技領域近日迎來一項引發廣泛討論的突破性實驗——Anthropic安全團隊研究員Nicholas Carlini帶領16個Claude智能體組成“AI特工隊”,在近乎零人工干預的條件下,用Rust語言從零開發出一款能跨架構編譯Linux內核的C編譯器。這項耗時兩周的實驗不僅驗證了AI在復雜軟件開發中的協作能力,更因高達2萬美元的API成本與20億輸入Token的消耗量,成為科技圈熱議的焦點。
實驗過程中,AI團隊展現了驚人的工作強度:通過近2000次代碼迭代,自主生成超過10萬行代碼,最終實現的編譯器成功在x86、ARM和RISC-V三種主流架構上完成Linux 6.9內核的編譯。這一成果打破了外界對AI僅能處理簡單編程任務的認知,證明其具備處理系統級軟件開發的潛力。Carlini特別強調,實驗中AI通過循環指令實現24小時不間斷工作,能夠自主識別并解決“下一個最明顯的問題”,這種持續迭代能力顯著超越人類開發者的工作模式。
然而,實驗結果也暴露出當前AI編程的顯著局限。盡管產出規模驚人,但代碼質量仍與頂尖人類程序員存在差距,尤其在缺乏明確引導時,AI容易陷入重復測試的無效循環。GitHub社區的開發者指出,AI生成的代碼本質上是基于海量訓練數據的重組,而非真正意義上的“從零創作”。這種特性既帶來效率提升,也引發對代碼安全性與可維護性的擔憂——當AI依賴訓練數據中的潛在錯誤模式時,如何確保生成軟件的可靠性成為新課題。
這場實驗正在重塑行業對軟件自動化生產的認知。一方面,AI團隊協作模式為處理超大規模項目提供了新思路,其不間斷工作能力可顯著縮短開發周期;另一方面,實驗中暴露的效率與質量矛盾、安全驗證難題,迫使開發者重新思考人機協作的邊界。隨著類似技術逐漸滲透至關鍵基礎設施領域,如何建立針對AI生成代碼的審核機制,已成為行業亟待解決的現實問題。










