上海交通大學(xué)聯(lián)合上海人工智能實驗室與GAIR實驗室,在軟件自動修復(fù)領(lǐng)域取得突破性進(jìn)展。研究團(tuán)隊耗資147萬美元構(gòu)建的OpenSWE訓(xùn)練框架,成功訓(xùn)練出能自動修復(fù)代碼錯誤的人工智能系統(tǒng),相關(guān)成果已發(fā)表于arXiv論文庫(編號arXiv:2603.13023v1)。這項研究通過模擬45320個真實軟件修復(fù)場景,為AI提供了前所未有的學(xué)習(xí)環(huán)境,標(biāo)志著軟件開發(fā)方式可能迎來根本性變革。
傳統(tǒng)軟件開發(fā)中,程序員需花費(fèi)30%-50%的時間調(diào)試代碼。新研發(fā)的AI系統(tǒng)通過在海量真實案例中學(xué)習(xí),能像經(jīng)驗豐富的工程師般快速定位并修復(fù)問題。研究團(tuán)隊在GitHub收集了57萬份Python項目修復(fù)記錄,經(jīng)四層篩選機(jī)制保留高質(zhì)量案例,最終構(gòu)建出包含12800個真實項目的訓(xùn)練庫。每個訓(xùn)練場景都封裝在獨(dú)立Docker容器中,確保AI能在安全環(huán)境中嘗試各種修復(fù)方案。
項目核心創(chuàng)新在于多智能體協(xié)作系統(tǒng)。五個專業(yè)AI智能體組成自動化流水線:"倉庫探索專家"分析項目依賴關(guān)系,"Docker容器構(gòu)建師"創(chuàng)建標(biāo)準(zhǔn)化運(yùn)行環(huán)境,"評估腳本編寫師"開發(fā)測試腳本,"環(huán)境驗證師"確保環(huán)境配置正確,"測試分析師"把控最終質(zhì)量。這套系統(tǒng)在64臺云服務(wù)器組成的集群上運(yùn)行,僅GPU費(fèi)用就達(dá)86.5萬美元,最終生成1.3萬條高質(zhì)量修復(fù)軌跡。
在業(yè)界標(biāo)準(zhǔn)測試集SWE-Bench Verified上,320億參數(shù)模型取得62.4%的修復(fù)成功率,720億參數(shù)模型更達(dá)66.0%。這些真實項目中的復(fù)雜問題,需要AI同時理解代碼邏輯、定位錯誤根源并設(shè)計修復(fù)方案。研究還發(fā)現(xiàn),隨著訓(xùn)練數(shù)據(jù)規(guī)模擴(kuò)大,AI能力呈對數(shù)線性增長且未現(xiàn)飽和跡象,為技術(shù)持續(xù)優(yōu)化指明方向。更令人意外的是,該訓(xùn)練框架顯著提升了AI在數(shù)學(xué)推理(提升12%)和科學(xué)任務(wù)(提升5%)上的表現(xiàn)。
研究團(tuán)隊采取完全開源策略,公開了環(huán)境構(gòu)建系統(tǒng)源代碼、配置文件和部署指南。這套價值147萬美元的基礎(chǔ)設(shè)施,使其他研究機(jī)構(gòu)無需重復(fù)投入即可開展相關(guān)研究。詳細(xì)公布的計算節(jié)點(diǎn)配置參數(shù)和優(yōu)化策略,為全球開發(fā)者提供了寶貴實踐經(jīng)驗。GitHub平臺上的OpenSWE項目已吸引眾多開發(fā)者參與完善。
這項技術(shù)對軟件開發(fā)行業(yè)影響深遠(yuǎn)。企業(yè)可借此提升開發(fā)效率,將程序員從重復(fù)調(diào)試工作中解放出來,專注于創(chuàng)新功能開發(fā)。用戶將獲得更穩(wěn)定的軟件體驗,特別是移動應(yīng)用和Web服務(wù)領(lǐng)域?qū)@著減少故障響應(yīng)時間。教育領(lǐng)域也可能調(diào)整教學(xué)重點(diǎn),加強(qiáng)軟件架構(gòu)設(shè)計和AI協(xié)作能力培養(yǎng)。
盡管當(dāng)前系統(tǒng)主要針對Python語言優(yōu)化,且復(fù)雜系統(tǒng)性問題修復(fù)仍具挑戰(zhàn),但研究已證明大規(guī)模專業(yè)訓(xùn)練的有效性。中國研究團(tuán)隊通過設(shè)定技術(shù)標(biāo)準(zhǔn)和建立開源生態(tài)系統(tǒng),為全球AI競爭奠定基礎(chǔ)。這項基礎(chǔ)研究突破不僅展示技術(shù)可能性,更重新定義了人機(jī)協(xié)作模式——AI作為專業(yè)工具增強(qiáng)人類能力,而非簡單替代。
完整研究論文可通過arXiv:2603.13023v1查詢,所有代碼和數(shù)據(jù)已在GitHub平臺開源(項目地址:https://github.com/GAIR-NLP/OpenSWE)。該成果為軟件工程自動化提供了新范式,其開源策略更推動整個研究領(lǐng)域向更透明、可復(fù)現(xiàn)的方向發(fā)展。











