阿里巴巴達摩院近日宣布推出具身智能領域的重要成果——RynnBrain基礎模型,并同步開源包含30B混合專家架構(MoE)在內的七個全尺寸模型。這一系列模型覆蓋從基礎架構到專業后訓練的全鏈條,其中30B MoE模型作為全球首個同類架構的具身模型,通過降低推理資源需求顯著提升了機器人響應效率,為行業研發提供了全新解決方案。
傳統具身智能模型長期面臨兩大技術瓶頸:動態環境下的記憶丟失問題與物理空間認知偏差導致的"幻覺"現象。RynnBrain通過創新性的時空記憶模塊與物理空間推理引擎,首次實現了機器人對三維空間的連續認知能力。該模型可基于歷史軌跡預測物體運動方向,在復雜場景中保持環境感知的連貫性,其文本-空間交叉驗證機制使決策過程更符合物理規律。
技術實現層面,研發團隊基于Qwen3-VL架構進行深度優化,采用自研的RynnScale訓練框架使同等算力下的訓練效率提升200%。通過處理超過2000萬組多模態數據,模型在環境感知、運動控制等16項核心指標上刷新行業紀錄,綜合性能超越谷歌Gemini Robotics ER 1.5和英偉達Cosmos Reason 2等國際領先模型。特別在資源利用率方面,30B MoE模型僅需激活30億參數即可達到720億參數模型的性能水平,大幅降低硬件部署成本。
為推動行業標準化發展,達摩院同步開源了RynnBrain-Bench評測基準。該基準包含200余項時空細粒度任務,涵蓋動態物體追蹤、空間關系推理等復雜場景,填補了現有評測體系在物理世界交互能力評估方面的空白。開源模型與評測工具的雙重釋放,為全球開發者提供了從算法優化到效果驗證的完整工具鏈。
此次開源的模型矩陣包含1.5B至30B不同參數規模版本,支持從嵌入式設備到云端服務器的多場景部署。其中輕量化版本在保持核心功能的同時,將推理延遲控制在毫秒級,為服務機器人、工業機械臂等實時交互設備提供了可行的技術路徑。行業分析師指出,這種全尺寸開源策略將加速具身智能技術從實驗室走向商業化應用。










