4月10日消息,百度智能云的伐謀Agent 2.0又拿下一個(gè)世界級(jí)第一,在機(jī)器學(xué)習(xí)工程權(quán)威基準(zhǔn)MLE-Bench上登頂,還刷新了最好成績(jī)。
這個(gè)評(píng)測(cè)是OpenAI主導(dǎo)設(shè)立的,里面有75個(gè)來(lái)自Kaggle的真實(shí)工程難題,專門考驗(yàn)AI在數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、實(shí)驗(yàn)運(yùn)行等全流程的實(shí)戰(zhàn)能力。
最新結(jié)果顯示,在統(tǒng)一標(biāo)準(zhǔn)下,伐謀Agent 2.0在高難度任務(wù)上表現(xiàn)突出,綜合得分超過(guò)了搭載Claude-Opus-4.6等主流大模型的同類智能體。
它用了更強(qiáng)的演化策略,可以多條路徑同時(shí)探索,不對(duì)就及時(shí)調(diào)整。新增的長(zhǎng)程記憶機(jī)制,能讓AI在復(fù)雜長(zhǎng)流程任務(wù)里保持邏輯清晰,不跑偏。
同時(shí)依托百度智能云的全棧AI基礎(chǔ)設(shè)施,算法迭代速度更快,普通人用自然語(yǔ)言就能操作,不用懂復(fù)雜技術(shù)也能拿到企業(yè)級(jí)解決方案。
目前伐謀已經(jīng)落地到多個(gè)行業(yè)。
在汽車制造領(lǐng)域,阿爾特汽車的風(fēng)阻驗(yàn)證從小時(shí)級(jí)縮短到分鐘級(jí)。
在金融風(fēng)控方面,中信百信銀行的模型風(fēng)險(xiǎn)區(qū)分度提升2.41%。
在交通優(yōu)化上,鄂爾多斯伊金霍洛旗高峰通行時(shí)間減少一半以上。
這款智能體上線后,已經(jīng)有數(shù)千家企業(yè)使用,覆蓋零售、金融、制造、能源、交通等多個(gè)關(guān)鍵領(lǐng)域。
官方消息顯示,5月13日到14日,在北京舉辦的Create2026百度AI開(kāi)發(fā)者大會(huì)上,伐謀Agent 2.0會(huì)正式發(fā)布。









