阿里巴巴旗下高德公司近日宣布推出兩款突破性技術模型——具身操作基座模型ABot-M0與具身導航基座模型ABot-N0,標志著全球機器人技術向通用化、規(guī)模化應用邁出關鍵一步。這兩項成果不僅填補了機器人操作通用性與導航長程性兩大技術空白,更在七項國際權威基準測試中刷新世界紀錄,使高德成為全球首個在具身操作與導航領域同步達到SOTA(當前最優(yōu)水平)的企業(yè)。
針對機器人行業(yè)長期存在的數(shù)據(jù)孤島問題,ABot-M0通過構建全球最大規(guī)模的通用機器人數(shù)據(jù)集實現(xiàn)突破。該模型整合超過600萬條真實操作軌跡,創(chuàng)新采用統(tǒng)一動作表示體系,將不同機器人廠商的異構數(shù)據(jù)轉化為標準化格式。通過增量式動作建模技術,模型可跨平臺融合多源數(shù)據(jù),支持完全基于公開數(shù)據(jù)的預訓練。在算法層面,其首創(chuàng)的動作流形學習(AML)算法,將機器人動作約束在低維流形空間,使動作預測準確率提升40%,解碼效率提高3倍。
空間感知能力的升級是ABot-M0的另一核心創(chuàng)新。通過引入3D感知模塊,模型可精準解析"前后遮擋""遠近層次"等復雜空間關系。在Libero-Plus基準測試中,該模型以80.5%的任務成功率領先行業(yè),較第二名方案提升近30個百分點。特別是在動態(tài)場景測試中,其能穩(wěn)定處理物體移動、光照變化等干擾因素,展現(xiàn)出強大的環(huán)境適應性。
在導航領域,ABot-N0通過"全任務統(tǒng)一"架構破解傳統(tǒng)模型碎片化難題。該模型首次將點位導航、目標導航、指令跟隨、興趣點導航及人物跟隨五大核心任務集成于單一架構,支持復雜指令的自動分解執(zhí)行。當用戶發(fā)出"去奶茶店買奶茶并占座"的指令時,系統(tǒng)可自動規(guī)劃包含地圖定位、路徑切換、柜臺導航、座位尋找的完整行動鏈。這種多任務協(xié)同能力,使機器人能處理包含12個以上子任務的超長程指令。
技術實現(xiàn)上,ABot-N0采用層次化"認知-動作"架構。其"認知大腦"基于Transformer模型進行指令理解與推理規(guī)劃,"動作專家"則通過流匹配算法生成符合物理規(guī)律的運動軌跡。數(shù)據(jù)引擎方面,高德依托自身地圖數(shù)據(jù)優(yōu)勢,構建了包含8000個高保真3D場景、1700萬條專家示例的龐大數(shù)據(jù)庫。在SocNav閉環(huán)仿真測試中,該模型成功率較前紀錄提升40.5%,HM3D-OVON測試中提升8.8%,展現(xiàn)出卓越的環(huán)境泛化能力。
為解決長程任務執(zhí)行中的容錯問題,高德同步推出Agentic Navigation System導航系統(tǒng)框架。該系統(tǒng)通過持續(xù)感知-記憶-決策-糾錯閉環(huán)機制,使機器人具備動態(tài)環(huán)境適應能力。在真實四足機器人平臺的部署測試中,系統(tǒng)實現(xiàn)邊緣端高效推理,在復雜室內(nèi)外場景中保持98.7%的任務連續(xù)性,驗證了其工業(yè)級穩(wěn)定性。目前,相關技術已應用于物流、服務等多個領域,推動機器人從實驗室走向真實應用場景。











