宇樹科技(Unitree)正式發(fā)布并開源了名為OmniXtreme的人形機(jī)器人運(yùn)動(dòng)控制架構(gòu),同步公開由創(chuàng)始人王興興署名的技術(shù)論文。該架構(gòu)針對人形機(jī)器人在春晚等高動(dòng)態(tài)場景下的極限動(dòng)作表現(xiàn),系統(tǒng)性地解決了海量動(dòng)作庫追蹤時(shí)的保真度下降與物理落地難題。
OmniXtreme采用雙階段訓(xùn)練框架:首階段通過流匹配預(yù)訓(xùn)練(Scalable Flow-based Pretraining),將分布在不同專家策略中的高動(dòng)態(tài)技能(如后空翻、武術(shù)、街舞)蒸餾至統(tǒng)一模型,利用生成式建模學(xué)習(xí)速度場路徑,有效規(guī)避了傳統(tǒng)強(qiáng)化學(xué)習(xí)在多任務(wù)下的梯度干擾;第二階段則引入執(zhí)行器感知后訓(xùn)練(Actuation-Aware Post-Training),通過殘差強(qiáng)化學(xué)習(xí)與寫實(shí)的力矩-轉(zhuǎn)速包絡(luò)線建模,使機(jī)器人能針對電機(jī)物理極限與再生功率進(jìn)行自我修正。
實(shí)驗(yàn)數(shù)據(jù)顯示,該架構(gòu)在Unitree G1硬件上實(shí)現(xiàn)了96.36%的后空翻成功率,端到端推理延遲壓縮至10毫秒。OmniXtreme的開源不僅展示了流匹配技術(shù)在具身智能領(lǐng)域的卓越擴(kuò)展性,更標(biāo)志著人形機(jī)器人從單一技能復(fù)現(xiàn)向通用、高保真運(yùn)動(dòng)能力的跨越,為行業(yè)探索復(fù)雜物理環(huán)境下的穩(wěn)健控制提供了關(guān)鍵技術(shù)范式。











