滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

高德發(fā)布ABot具身操作和具身導(dǎo)航基座模型，斬獲10項(xiàng)全球權(quán)威基準(zhǔn)評測第一

時間：2026-02-12 22:00:19 來源：鞭牛士編輯：快訊 IP：北京 發(fā)表評論無障礙通道

近日，阿里巴巴集團(tuán)旗下高德正式發(fā)布具身操作基座模型ABot-M0與具身導(dǎo)航基座模型ABot-N0，補(bǔ)齊了具身機(jī)器人規(guī)模化落地的兩塊核心能力——操作的通用性和導(dǎo)航的長程性，并刷新了全球多項(xiàng)權(quán)威評測紀(jì)錄，高德也成為全球首個在具身導(dǎo)航與具身操作上同步達(dá)到SOTA（目前最好、最先進(jìn)的模型）的廠商。

ABot-M0：全球首個統(tǒng)一架構(gòu)的機(jī)器人基礎(chǔ)模型，讓機(jī)器人擁有"通用大腦"

長期以來，機(jī)器人技術(shù)的規(guī)模化應(yīng)用面臨諸多挑戰(zhàn)，其中關(guān)鍵之一在于數(shù)據(jù)的割裂、動作表示的不統(tǒng)一以及空間理解能力的不足。不同廠商、不同形態(tài)的機(jī)器人往往使用各自獨(dú)立的數(shù)據(jù)體系，導(dǎo)致模型難以跨平臺復(fù)用，訓(xùn)練效率受限，部署成本高。

高德推出的 ABot-M0 作為一款通用的具身操作基礎(chǔ)模型，從“數(shù)據(jù)統(tǒng)一—算法革新—空間感知”三個方面進(jìn)行了系統(tǒng)性重構(gòu)，致力于提升模型在多樣化機(jī)器人形態(tài)和任務(wù)場景下的泛化能力。

ABot-M0模型架構(gòu)圖

ABot-M0 基于全球開源資源，整合超過 600 萬條真實(shí)操作軌跡，構(gòu)建了目前規(guī)模最大的通用機(jī)器人數(shù)據(jù)集。通過統(tǒng)一動作表示、坐標(biāo)系與控制頻率，并采用增量式動作建模，實(shí)現(xiàn)了跨平臺數(shù)據(jù)融合，支撐了完全基于公開數(shù)據(jù)的預(yù)訓(xùn)練。

算法革新上，ABot-M0 提出了全球首個動作流形學(xué)習(xí)：有效的機(jī)器人動作受限于物理規(guī)律、任務(wù)目標(biāo)與環(huán)境約束，集中分布在低維結(jié)構(gòu)化的流形上。設(shè)計(jì)了 AML（Action Manifold Learning）算法，使模型能夠直接預(yù)測結(jié)構(gòu)合理、物理可行的動作序列，提升策略的穩(wěn)定性與解碼效率。

為增強(qiáng)空間感知，ABot-M0 引入 3D 感知模塊，增強(qiáng)模型對“前后、遠(yuǎn)近、遮擋”等空間語義的理解，在復(fù)雜環(huán)境中實(shí)現(xiàn)更精準(zhǔn)的操作決策。

在 Libero、Libero-Plus、RoboCasa 基準(zhǔn)測試中，該模型在包含復(fù)雜任務(wù)組合與動態(tài)場景擾動的設(shè)定下，平均任務(wù)成功率均達(dá)到 SOTA。其中，Libero-Plus 基準(zhǔn)上達(dá)到了 80.5%，較業(yè)界先進(jìn)方案pi0提升近30%，展現(xiàn)了其在高擾動高難度具身操作任務(wù)中的領(lǐng)先性能。

ABot-M0在Libero-Plus的評測

通過系統(tǒng)的工程設(shè)計(jì)與算法改進(jìn)，ABot-M0 探索了一條通向通用具身智能的技術(shù)路徑，也為未來開放、共享的機(jī)器人生態(tài)提供了可復(fù)現(xiàn)、可擴(kuò)展的基礎(chǔ)支持。

ABot-N0：全球首個五大導(dǎo)航任務(wù)統(tǒng)一的全棧導(dǎo)航基座模型

導(dǎo)航是機(jī)器人進(jìn)入物理開放世界的核心基礎(chǔ)能力，機(jī)器人需要在動態(tài)且存在干擾的環(huán)境里展現(xiàn)出通用的行動能力，如跨場景送物或跟隨服務(wù)，這同時也是具身智能演進(jìn)的終極命題。

然而，當(dāng)前的具身導(dǎo)航研究普遍深陷“碎片化”：主流方法往往針對特定任務(wù)構(gòu)建孤立的專用架構(gòu)，這不僅限制了模型的跨任務(wù)泛化能力，更阻礙了智能體從海量異構(gòu)數(shù)據(jù)中提取統(tǒng)一物理先驗(yàn)的可能性。

這也是當(dāng)前機(jī)器人常陷于“環(huán)境看不懂、動作做不準(zhǔn)”的核心原因，復(fù)雜指令（如“去門口幫我看看快遞”）更是難以執(zhí)行。

高德推出的具身導(dǎo)航基座模型ABot-N0，以“全任務(wù)一統(tǒng)”為核心目標(biāo)，并實(shí)現(xiàn)全球首次在單一模型中完整集成Point-Goal（點(diǎn)位導(dǎo)航）、Object-Goal（目標(biāo)導(dǎo)航）、Instruction-Following（指令跟隨）、POI-Goal（興趣點(diǎn)導(dǎo)航）與Person-Following（人物跟隨）五大導(dǎo)航任務(wù)，有效突破了傳統(tǒng)架構(gòu)中任務(wù)割裂的瓶頸。

比如，當(dāng)用戶對搭載ABot-N0的具身機(jī)器人說：“帶我去奶茶店買一杯奶茶，再幫我占個座。”時系統(tǒng)會自動分解為具體的導(dǎo)航任務(wù)：首先執(zhí)行Point-Goal，根據(jù)地圖記憶接近奶茶店區(qū)域；之后切換至POI-Goal，精準(zhǔn)鎖定店鋪入口并靠近；隨后觸發(fā)Instruction-Following，進(jìn)入店鋪并導(dǎo)航至柜臺；最后執(zhí)行Object-Goal，在店內(nèi)尋找空沙發(fā)并停靠。

相較于只能支持部分任務(wù)的具身導(dǎo)航模型，高德ABot-N0所實(shí)現(xiàn)的五大導(dǎo)航任務(wù)給長程復(fù)雜任務(wù)的執(zhí)行提供了可行的解決方案。這一能力背后，是高德在架構(gòu)設(shè)計(jì)、數(shù)據(jù)引擎和系統(tǒng)框架上的關(guān)鍵革新。

ABot-N0的數(shù)據(jù)、性能、任務(wù)概覽

在模型架構(gòu)上，ABot-N0采用層次化的“大腦?動作”設(shè)計(jì)哲學(xué)：由“認(rèn)知大腦”理解指令并做推理，由基于流匹配（Flow Matching）的“動作專家”生成精確且多峰分布的連續(xù)軌跡。訓(xùn)練上，先讓模型做認(rèn)知訓(xùn)練熱身，再用部分認(rèn)知數(shù)據(jù)和海量導(dǎo)航動作進(jìn)行聯(lián)合監(jiān)督微調(diào)，最后用強(qiáng)化學(xué)習(xí)把導(dǎo)航?jīng)Q策對齊到人類偏好的行為價(jià)值，最終打造出真實(shí)環(huán)境中更通用的VLA基座模型。

在數(shù)據(jù)側(cè)，依托高德長期沉淀的場景資產(chǎn)和專家示例，高德構(gòu)建了業(yè)內(nèi)最大規(guī)模的具身導(dǎo)航數(shù)據(jù)引擎，涵蓋約 8000 個高保真 3D 場景等海量時空數(shù)據(jù)與近1700萬條專家示例，從而增強(qiáng)模型在真實(shí)環(huán)境中的泛化能力與魯棒性。

基于ABot-N0的系統(tǒng)性創(chuàng)新，其在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大權(quán)威基準(zhǔn)測試中全面刷新了世界紀(jì)錄。其中在SocNav閉環(huán)仿真中，成功率（SR）飆升40.5%，在HM3D-OVON評測中成功率（SR）提升8.8%，均顯著強(qiáng)于之前的SOTA模型。

Point-Goal任務(wù)：在CityWalker及SocNav上分別進(jìn)行開環(huán)和閉環(huán)評測

為了解決機(jī)器人在執(zhí)行長程復(fù)雜任務(wù)時的任務(wù)拆解與容錯問題，高德提出了可落地的Agentic Navigation System具身導(dǎo)航系統(tǒng)框架，行成從“讀懂指令”到“長程復(fù)雜任務(wù)執(zhí)行”的閉環(huán)能力架構(gòu)，支持機(jī)器人在執(zhí)行過程中持續(xù)感知、記憶、決策與糾錯。系統(tǒng)已成功部署于真實(shí)四足機(jī)器人平臺，并在邊緣側(cè)實(shí)現(xiàn)了高效推理與閉環(huán)控制，驗(yàn)證了其在動態(tài)現(xiàn)實(shí)環(huán)境中的泛化性能與工業(yè)級穩(wěn)定性。

02-12

Alphabet 財(cái)報(bào)電話會避談蘋果合作

02-12

Meta為Facebook推出三項(xiàng)AI功能

02-12

Meta推出Dear Algo功能

02-12

Meta斥資100億美元在印第安納州動工建設(shè)新數(shù)據(jù)中心

02-12

1800億！京東與美的、海爾、海信、TCL明確2026全渠道銷售目標(biāo)

02-12

高德發(fā)布ABot具身操作和具身導(dǎo)航基座模型

02-12

豆包上線Seedance2.0：馬斯克點(diǎn)贊美國導(dǎo)演稱或?qū)㈩嵏埠萌R塢

02-12

字節(jié)發(fā)布Seedance 2.0：多模態(tài)升級，可控性提升，賦能工業(yè)級視頻創(chuàng)作

02-12

AI時代數(shù)據(jù)治理：企業(yè)數(shù)智化升級的基石與生成式AI落地的關(guān)鍵支撐

02-12

抖音“長輩模式”再升級：反詐預(yù)警通知為老人筑牢安全防線

02-12

蔡崇信憶阿里往事：被馬云直言“不懂運(yùn)營”后轉(zhuǎn)崗，仍視其為導(dǎo)師

02-12

小米汽車響應(yīng)《汽車行業(yè)價(jià)格行為合規(guī)指南》，共促產(chǎn)業(yè)公平高質(zhì)量發(fā)展

02-12

小米YU7銷量一路高歌猛進(jìn)，2026年1月強(qiáng)勢登頂國內(nèi)乘用車銷冠寶座

02-12

百度智能云率先完成GLM-5適配，攜手昆侖芯P800賦能國產(chǎn)大模型生態(tài)發(fā)展

02-12

點(diǎn)擊查看更多 +

全站最新

前蘋果設(shè)計(jì)師助力法拉利，Luce內(nèi)飾實(shí)體操控成亮點(diǎn)，5月亮相引期待

2026AMR展會：新能源維保領(lǐng)航，數(shù)字化賦能維修終端新未來

資金動向 | 北水加倉騰訊控股超14億，連續(xù)3日凈買入美團(tuán)

新股暗盤｜海致科技集團(tuán)暗盤收漲210.42% 一手賺11388港元

春節(jié)假期在機(jī)場、火車站打滴滴找準(zhǔn)"滴滴車站"

成大生物（本溪）有限公司高劑量流感疫苗獲批開展臨床試驗(yàn)

熱門內(nèi)容

本欄最新

AI時代數(shù)據(jù)治理：企業(yè)數(shù)智化升級的基石與生成式AI落地的關(guān)鍵支撐

抖音“長輩模式”再升級：反詐預(yù)警通知為老人筑牢安全防線

Seedance 2.0引領(lǐng)AI視頻革命：技術(shù)突破、行業(yè)沖擊與未來展望

小紅書新規(guī)下“藍(lán)帽子”禁推勁酒流量退潮后增長路在何方

字節(jié)跳動Seedance 2.0：AI視頻生成新突破，引領(lǐng)全球創(chuàng)作新潮流

馬斯克點(diǎn)贊Seedance2.0，視頻模型發(fā)展迅猛引全球熱議

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

高德發(fā)布ABot具身操作和具身導(dǎo)航基座模型，斬獲10項(xiàng)全球權(quán)威基準(zhǔn)評測第一