3月17日消息,據媒體報道,2026亞布力論壇年會于3月17日-19日在黑龍江亞布力舉辦。宇樹科技創始人王興興表示指出,具身智能若要迎來類ChatGPT的革命性時刻,仍需攻克多項關鍵技術難題。
王興興認為,當前最核心的瓶頸在于泛化能力不足。機器人在預先訓練的場景中可以實現接近100%的任務成功率,但一旦環境發生改變,其性能便會大幅下降,難以適應復雜多變的現實場景。這一問題直接制約著機器人從實驗室走向真實應用的能力。
針對這一挑戰,他提出了三個突破方向:首先是提升模型的表達能力,增強機器人運動指令與動作的豐富度,為泛化能力筑牢基礎;其次是提高數據利用率,由于機器人領域訓練數據極度稀缺,必須在有限數據中挖掘更高價值,推動行業普惠發展;第三是強化強化學習的規模效應,進一步釋放算法潛力。
在技術路徑的選擇上,王興興明確表示長期看好基于視頻生成的世界模型。他解釋,這一路徑的邏輯與人類行為高度相似:先讓AI在“大腦”中想象并生成機器人執行任務的高質量視頻,再將生成視頻與機器人動作精準對齊,轉化為實際執行指令,從而讓機器人完成復雜任務。
王興興特別提到字節跳動的Seedance 2.0視頻生成技術,認為高保真、高可控的視頻生成是實現該路徑的重要基礎。
不過王興興也坦言,這一方向目前面臨全球共性難題——視頻生成內容與機器人實際動作難以精準對齊。這是制約機器人“大腦想象”轉化為“現實行動”的關鍵卡點。
王興興相信,一旦該問題得到解決,機器人通用模型將迎來根本性突破,具身智能的“ChatGPT時刻”也將真正到來。










