大曉機器人近日正式對外發布其開源的具身原生世界模型——Kairos 3.0-4B,這一模型以“多模態理解—生成—預測”一體化架構為核心,專為具身智能場景設計,能夠在端側直接驅動機器人本體完成復雜任務,標志著具身智能技術向實際應用邁出了重要一步。
據官方介紹,Kairos 3.0-4B在Jetson Thor T5000端側平臺上展現出接近實時的生成能力,支持生成最長可達7分鐘的連貫動態視頻,為機器人任務規劃與仿真訓練提供了高效工具。這一特性使得機器人能夠在更接近真實的環境中進行預演和優化,從而提升執行任務的準確性和效率。
在性能對比方面,基于A800 GPU的基準測試結果顯示,Kairos 3.0-4B的推理速度較Cosmos 2.5有顯著提升,達到約72倍。盡管模型參數規模為4B,顯存占用約23.5GB,但這一數據仍低于部分主流具身世界模型,同時保持了較高的推理效率,體現了其在資源利用上的優化能力。
Kairos 3.0-4B的另一大亮點是其跨機器人本體的泛化能力。該模型能夠適配單臂、雙臂及靈巧手等不同形態的機器人設備,并兼容多種機器人硬件平臺,為機器人技術的多樣化和普及化提供了有力支持。這種泛化能力使得模型能夠廣泛應用于不同場景,滿足不同用戶的需求。
在具身智能評測基準中,Kairos 3.0-4B同樣表現出色,在PAI-Bench-robot、WorldModelBench-robot TI2V等多項測試中均取得領先成績。開發團隊表示,該模型不僅可用于生成仿真訓練數據,還能直接驅動機器人執行真實任務,這一特性將極大地推動具身智能從仿真環境向實際應用的轉化。











