在工業自動化領域,機器人能否勝任高精度操作一直是制約其廣泛應用的關鍵瓶頸。近日,具身智能領域傳來突破性進展:Physical Intelligence團隊研發的RLT技術,通過為機器人添加"精細動作外掛",成功實現用十幾分鐘真實數據攻克擰微型螺絲、插網線等毫米級精度任務,部分場景效率甚至超越人類操作水平。
傳統機器人訓練面臨兩難困境:重新訓練整個大模型需要海量算力和漫長周期,而直接部署又難以應對工廠場景中"差之毫厘謬以千里"的精度要求。以擰M3螺絲為例,螺絲刀尖與抓取點存在10厘米距離,手腕微小偏移都會導致刀尖產生數倍誤差,更遑論從攝像頭視角難以捕捉的接觸過程。研究團隊創新性地采用"主腦+外掛"架構,在保留VLA大模型通用能力的同時,通過RL token技術實現精準動作的局部強化。
這套系統的工作原理猶如為機器人配備"智能手術刀"。VLA大模型首先生成包含任務全局理解的RL token,這個高度壓縮的信息摘要被輸入到專門訓練的Actor-Critic網絡中。這兩個輕量級神經網絡采用off-policy強化學習,每秒可更新數百次,能根據實時試錯數據快速調整動作策略。研究者特別設計了"動作塊預測"機制,使強化學習策略與VLA的原始動作空間保持一致,通過"編輯修改"而非"推翻重建"的方式優化關鍵動作。
實驗數據驗證了技術的有效性。在擰螺絲、系扎帶、插網線、插電源線四項任務中,裝備RLT的機器人僅需15分鐘真實數據訓練,關鍵步驟速度提升300%,整體任務吞吐量(每10分鐘成功次數)顯著提高。特別在插網線任務中,強化學習策略完成的操作有一半速度超過人類遠程操控記錄,訓練總時長2小時中僅有15分鐘用于實際動作數據采集。
技術突破的關鍵在于三大創新設計:參考動作dropout機制防止模型過度依賴VLA原始輸出,人類干預接口允許直接注入糾正動作,以及動作塊預測確保策略調整與任務時序匹配。這種模塊化設計使RLT成為可復用的"通用插件",無需針對不同任務重新設計,為工業機器人提供了"邊干邊學"的進化能力。當被問及技術落地前景時,研究團隊展示的測試視頻顯示,機器人已能穩定完成亞毫米級精度的螺絲擰入動作,這標志著自動化設備向取代人類精密操作邁出關鍵一步。











