在機器學習工程領域,一場由百度智能云引領的技術革新正引發全球關注。其自主研發的企業級算法優化智能體——百度伐謀Agent 2.0,近日在權威基準測試MLE-Bench中以絕對優勢登頂,并刷新了最優成績(SOTA)。這是該系統繼去年首次問鼎后,再次以工程化能力證明中國AI在復雜問題求解領域的領先地位。據悉,全新升級的2.0版本將于2026年5月的百度AI開發者大會上正式亮相。
MLE-Bench由OpenAI主導設立,堪稱智能體實戰能力的"試金石"。該測試集包含75個源自Kaggle競賽的真實工程難題,全面考察AI在模型訓練、數據處理、實驗優化等全流程中的端到端能力。百度伐謀2.0在此次評測中展現出卓越的攻堅實力,尤其在處理高復雜度任務時,其綜合勝率大幅領先搭載Claude-Opus-4.6等主流大模型的同類系統,驗證了其在系統性問題拆解與迭代優化方面的成熟度。
技術突破的背后是多項核心能力的升級。新版本引入的增強型演化策略,使智能體能夠并行探索多條解決方案路徑,并通過動態回溯機制持續優化;長程記憶機制則賦予系統類似人類工程師的邏輯連貫性,確保在跨步驟任務中保持決策一致性。更值得關注的是,依托百度智能云全棧AI基礎設施的深度優化,算法迭代效率獲得質的提升,為處理超大規模工程問題奠定基礎。
在降低使用門檻方面,百度伐謀2.0實現了革命性突破。業務人員無需算法背景,僅需通過自然語言描述需求或上傳數據文件,系統即可自動生成可解釋、可交互的決策方案。這種"零代碼"操作模式,使得企業級AI解決方案的落地周期從數月縮短至數周,真正實現了技術普惠。
實際應用場景中,百度伐謀已展現出強大的產業賦能能力。在汽車制造領域,阿爾特太乙公司借助該系統開發的御風智能預測系統,將風阻驗證時間從10小時壓縮至分鐘級,整車研發周期平均縮短25%;金融風控領域,中信百信銀行通過7×24小時風險特征挖掘,使模型區分度提升2.41%,效率翻倍;能源基建方面,中國能建廣東院應用該技術優化海上風電電纜布局,節省近一周工期與大量材料成本;交通信控領域,鄂爾多斯伊金霍洛旗引入智能信控平臺后,高峰時段車均延誤降低18%,通行時間縮減超50%。
科研創新領域同樣傳來捷報。北京工業大學團隊將其應用于中國空間站微型氣相色譜柱設計,通過自動化尋優替代人工仿真,分離效率獲得顯著提升;天津大學災害預測團隊利用該系統,將原本需要數周的模型選優流程壓縮至6小時內完成。為進一步推動科研范式變革,百度智能云近期開源了Famou for Science項目,構建包含實驗管理、文檔評審等角色的虛擬科研團隊,支持長線程任務的自動化推進與知識融合創新。
從技術榜單到千行百業,百度伐謀2.0的突破不僅刷新了工程能力指標,更標志著中國AI在解決真實世界復雜問題方面已形成獨特優勢。這種將前沿算法與產業需求深度結合的實踐,正在重新定義企業級AI的應用邊界。











