阿里巴巴達摩院近日在具身智能領域取得重大突破,正式推出全球首個具備時空記憶與物理世界推理能力的智能大腦基礎模型RynnBrain,并同步開源包含30B MoE架構在內(nèi)的7個全尺寸模型矩陣。該模型在16項國際權威評測中刷新紀錄,超越谷歌Gemini Robotics ER 1.5等頂尖系統(tǒng),標志著機器人智能水平邁入新階段。
傳統(tǒng)機器人系統(tǒng)在執(zhí)行多任務時面臨顯著局限,而RynnBrain通過創(chuàng)新性引入時空記憶模塊,使機器人具備任務狀態(tài)記憶能力。實驗顯示,當機器人執(zhí)行A任務途中被要求優(yōu)先完成B任務時,系統(tǒng)可精準記錄A任務的空間坐標、物體狀態(tài)及時間節(jié)點,待B任務完成后自動恢復A任務進程。這種能力在倉儲物流、醫(yī)療護理等復雜場景中具有重要應用價值。
在技術架構層面,RynnBrain突破性地實現(xiàn)認知、定位、推理、規(guī)劃等能力的深度融合。通過模塊化設計,該模型可快速衍生出導航、操作、交互等垂直領域模型。以具身規(guī)劃模型為例,僅需數(shù)百條場景數(shù)據(jù)微調(diào)即可達到行業(yè)領先水平,在動態(tài)障礙物避讓、多目標路徑優(yōu)化等任務中表現(xiàn)尤為突出。
開源生態(tài)建設方面,達摩院此次釋放的模型矩陣涵蓋從1B到30B不同參數(shù)規(guī)模,其中30B MoE模型通過專家混合架構實現(xiàn)效率躍升,使機器人動作響應速度提升40%。配套發(fā)布的RynnBrain-Bench評測基準,首次建立時空細粒度任務評估體系,包含動態(tài)環(huán)境適應、長期任務記憶等200余項測試指標,為行業(yè)提供標準化評估工具。
據(jù)項目負責人趙德麗介紹,RynnBrain的研發(fā)突破了傳統(tǒng)具身智能"大腦-小腦"分離架構的局限,通過構建統(tǒng)一的世界模型實現(xiàn)感知-認知-決策的閉環(huán)。目前該系統(tǒng)已在工業(yè)分揀、家庭服務等場景完成驗證,其多模態(tài)交互能力可支持機器人理解復雜指令并自主規(guī)劃解決方案。
達摩院具身智能實驗室同步開源了WorldVLA視覺語言動作模型、RynnEC世界理解框架等組件,并制定首個機器人上下文通信協(xié)議RynnRCP。這些技術成果將降低具身智能研發(fā)門檻,推動AI技術從數(shù)字空間向物理世界的加速滲透。








