近日,百度智能云推出的企業級算法自主優化智能體——百度伐謀Agent 2.0,再次登頂機器學習工程權威基準MLE-Bench,并刷新SOTA(最優)成績。這是繼去年10月首次登頂后,百度伐謀憑借頂尖的工程能力再一次領跑全球。據悉,百度伐謀2.0將在今年5月的Create 2026百度AI開發者大會上正式發布。
?

?
由OpenAI主導設立的MLE-Bench是檢驗智能體“動手能力”的硬核考場。它包含75個來自Kaggle競賽的真實工程難題,重點考察人工智能在模型訓練、數據準備、實驗運行等機器學習全流程中的端到端實戰能力。作為一個尋找最優解的智能體,百度伐謀對于任何具有明確評價標準的問題,都能像頂尖算法工程師一樣,完成從需求理解到最優解輸出的全鏈路自動化,尋找全局最優解。去年10月,百度伐謀發布即登頂MLE-Bench。
最新的評測中,百度伐謀 2.0在“高難度”任務上的攻堅能力依舊表現突出,綜合勝率顯著領先。評測顯示,在統一運行標準下,百度伐謀2.0在“高難度”任務上的綜合勝率顯著領先,超越了搭載Claude-Opus-4.6等主流大模型的同類智能體,再次印證了百度伐謀在系統性分析復雜問題、迭代優化解決方案的成熟能力。
據了解,百度伐謀2.0在演化策略、長程記憶機制、底層基礎設施等層面進行了全面優化。其中,增強的演化策略能夠讓智能體在多條路徑上并行探索,適時回溯調整,從而找到更優的解決方案;其長程記憶機制能夠幫助智能體在人類工程師一樣,在長鏈條任務中保持思路清晰、邏輯一致;依托百度智能云全棧AI云基礎設施優化則讓算法演化迭代的效率顯著提升。
同時,百度伐謀 2.0還大幅降低了算法使用門檻,即便沒有算法背景的業務人員,也能以自然語言和數據文件發起需求,系統自動交付可解釋、可交互、可落地的決策方案,快速產出企業級解決方案。
百度伐謀上線至今已經吸引數千家企業使用,覆蓋零售、金融、制造、能源、交通等國民經濟核心領域。
在汽車制造領域,阿爾特太乙與伐謀合作研發御風智能預測系統,將單次風阻驗證時間從10小時壓縮至數分鐘,整車研發周期平均縮短25%;在金融風控領域,中信百信銀行引入伐謀7×24小時不間斷挖掘風險特征,效率提升100%,風控模型風險區分度提升2.41%;在能源基建領域,中國能建廣東院用伐謀解決海上風電電纜橋架布置難題,節省近一周工期與大量材料成本;在交通信控領域,鄂爾多斯伊金霍洛旗引入百度智能云伐謀信控平臺后,車均延誤降低18%,高峰通行用時降低50%以上。
百度伐謀在科研場景同樣展現出巨大應用價值。北京工業大學團隊將伐謀引入中國空間站微型氣相色譜柱設計實驗,以自動化尋優代替人工反復仿真,大幅提升分離效率;天津大學團隊將伐謀用于災害預測模型選優,把原本以"周"為單位的科研探索壓縮至6小時內出成果。
為進一步降低科研團隊的使用門檻,百度智能云近期還開源了Famou for Science項目,基于多智能體協同模式構建完整虛擬科研團隊,涵蓋團隊負責人、實驗管理、文檔管理與評審等角色,可支持長線程科研任務的自動化推進,實現學科知識機理和樣本數據融合的創新算法實驗持續演化。
業界認為,從MLE-Bench榜單到千行百業,百度伐謀2.0的再度登頂不只是技術指標的刷新,更是中國AI在企業級算法工程領域持續深耕的有力證明。











