在機器學習工程領域,一場由AI智能體引發的變革正在悄然發生。近日,一款名為伐謀Agent 2.0的智能體在MLE-Bench權威基準測試中脫穎而出,以刷新紀錄的成績登頂全球榜首,引發行業高度關注。這項由OpenAI主導設立的評測體系,通過75個源自Kaggle的真實工程難題,全面檢驗AI在數據預處理、模型調優、實驗執行等全鏈條環節的實戰能力。
測試數據顯示,在統一評估標準下,該智能體在高復雜度任務中展現出顯著優勢,綜合表現超越搭載Claude-Opus-4.6等主流大模型的同類產品。其核心技術突破體現在兩方面:一是采用新型演化策略,通過多路徑并行探索實現快速迭代,遇到偏差時能即時修正方向;二是引入長程記憶機制,使AI在處理跨度長達數小時的復雜任務時,仍能保持邏輯連貫性,避免執行路徑偏移。
支撐這項突破的,是百度智能云構建的全棧AI基礎設施。該平臺通過算力資源的高效調度與算法模型的深度優化,將模型迭代周期縮短至行業平均水平的三分之一。更值得關注的是其用戶友好性設計——普通業務人員通過自然語言指令即可完成復雜操作,無需具備專業技術背景即可獲取企業級解決方案。這種"零門檻"特性,正在打破AI技術落地的傳統壁壘。
在實體產業應用層面,該技術已顯現出強大賦能效應。汽車制造領域,阿爾特汽車將風阻驗證流程從數小時壓縮至分鐘級;金融風控場景中,中信百信銀行的模型風險識別準確率提升2.41個百分點;交通優化方面,鄂爾多斯伊金霍洛旗的早晚高峰通行時間減少超過50%。這些數據背后,是AI技術對傳統業務流程的深度重構。
據統計,自試運行以來,已有超過3000家企業引入該智能體,覆蓋零售、能源、制造等12個國民經濟重點行業。這種跨領域的快速滲透,既驗證了技術的通用性,也反映出實體經濟對智能化升級的迫切需求。值得關注的是,其應用場景正從單一環節優化向全價值鏈重構延伸,例如在供應鏈管理中同時實現需求預測、庫存優化和物流調度的一體化改進。
這場技術突破的完整展示窗口即將開啟。5月13日至14日,在北京舉行的Create2026百度AI開發者大會上,研發團隊將正式發布伐謀Agent 2.0,并詳細解密其技術架構與創新機制。屆時,來自全球的開發者將有機會現場體驗這款智能體的核心能力,共同探討AI工程化落地的未來路徑。










