在機器人技術領域,如何讓機械靈巧手擁有類似人類的觸覺感知與精細操作能力,一直是科研人員攻克的重點方向。初創(chuàng)公司Sharpa憑借其創(chuàng)新性的技術路徑,為這一難題提供了全新解法,僅用一年多時間便探索出從仿真建模到分層控制的實踐路徑。
Sharpa推出的Wave靈巧手集成22個主動自由度,與人手比例達到1:1,配備高分辨率觸覺傳感器,兼具動態(tài)響應能力與友好開發(fā)環(huán)境。這款產品為機器人靈巧操作及高質量具身數據采集開辟了新可能,但隨之而來的挑戰(zhàn)同樣顯著:數據采集復雜度陡增、視覺與觸覺模態(tài)競爭加劇、計算開銷大幅上升。若選擇夾爪與純視覺技術路徑,雖能快速完成特定任務演示,卻會面臨未來范式轉移與硬件重構的雙重困境。
面對技術瓶頸,Sharpa選擇了一條更具挑戰(zhàn)性的道路——將觸覺靈巧手作為核心工具,通過分層計算架構解鎖新方法。其提出的"分級動作生成"策略巧妙復刻人類肌肉記憶:以"伸手取水杯"為例,系統先通過視覺引導手臂接近目標并調整手掌姿態(tài),待接觸發(fā)生后,觸覺與本體覺立即接管控制權,完成捏、轉、提等精細動作。這種"先視覺定向,后觸覺微調"的分級模式,既符合物理交互直覺,又大幅降低計算負擔,使AI無需全程依賴視覺算力。
從生成式概率模型視角審視,該策略可理解為兩級條件概率漏斗的協同運作:視覺主導的初級漏斗負責生成粗略動作與整體意圖,觸覺主導的次級漏斗則結合實時手感信息生成精細動作。這種設計暗合人類神經系統分級構造,通過多級協同實現熵減與動作生成。基于此認知,Sharpa構建了由System 2、System 1、System 0組成的三重系統架構。
System 2作為邏輯推理中樞,將復雜任務拆解為語義明確的子任務;System 1扮演規(guī)劃師角色,結合視覺觀察輸出物理含義的粗動作軌跡;System 0則作為緊貼物理世界的執(zhí)行者,通過觸覺與本體覺反饋實現高頻精細控制。這種架構設計巧妙平衡計算開銷與實時控制需求:推理頻次最高的System 0采用極小模型規(guī)模,確保100Hz級高頻反饋;規(guī)模龐大的System 2在后臺低頻運轉,避免算力浪費。同時,每級系統設定絕對主導感知模態(tài),有效緩解模態(tài)沖突問題。
作為系統核心的System 0采用流匹配模型,以delta動作(關節(jié)角或關鍵點調節(jié)量)為輸出,通過極致簡化設計實現推理速度突破:模型參數壓縮至極限,流場ODE解算步驟大幅削減,觀測幀數控制在5幀以內。這種短程、高頻的實時控制設計,使其既能與System 1協同完成自主任務,也可單獨對接遙操作設備進行數據采集。在"手內重定向"與"雙指搓球"實驗中,接入System 0的機器手展現出驚人穩(wěn)定性,能自動過濾操作抖動并維持受力平衡,仿佛具備磁吸效應。
觸覺規(guī)律的數字化建模是系統實現的關鍵突破。Sharpa團隊在NVIDIA Isaac Sim中構建高精度數字孿生,通過凸包技術優(yōu)化幾何計算,并開發(fā)專用插件模擬彈性體形變。實驗數據顯示,該方案接觸點誤差小于1毫米,受力誤差控制在0.5牛以內,形變重合度超85%。在強化學習階段,團隊采用PPO算法訓練教師策略,將力學常識編碼為獎懲機制,再通過策略蒸餾剝離仿真特權信息,使學生策略可直接零樣本部署至真實機械手。
這種仿真生成與真機微調相結合的閉環(huán)路徑,有效解決了具身智能落地的數據困境。預訓練的System 0級聯遙操作設備后,數據采集效率與質量顯著提升,還能實現異地人機協同;接入System 1的高層認知模塊后,系統可從互聯網視頻中提取任務規(guī)律,形成完整的控制閉環(huán)。面對Sim2Real挑戰(zhàn),高保真物理建模與生成式AI的閉環(huán)魯棒性構成雙重保障:前者基于硬件特性針對性建模實現零樣本遷移,后者通過概率生成機制持續(xù)響應誤差,自然消化部分仿真到現實的偏差。










