機(jī)器人領(lǐng)域的風(fēng)向可能又要變了。
1 月 28 日,F(xiàn)igure 發(fā)布了自己最新的模型 Helix 02,并配上了一段三分半左右的視頻演示。
作為普通人,乍一看這個(gè)視頻可能覺(jué)得平平無(wú)奇,只是一個(gè)機(jī)器人在廚房里走來(lái)走去,做了一些把碗從洗碗機(jī)里拿出來(lái)收到柜子里之類的操作。
不過(guò),就在視頻快要結(jié)束之時(shí),出現(xiàn)了一個(gè)極其擬人的動(dòng)作。
它在關(guān)洗碗機(jī)的門(mén)時(shí),先是用腳頂了一下,把洗碗機(jī)的門(mén)踢了起來(lái),隨后才彎腰關(guān)上了門(mén)。
機(jī)器人收碗可能之前是見(jiàn)過(guò)的,但這個(gè)動(dòng)作之前卻沒(méi)有見(jiàn)過(guò)。
過(guò)去我們熟悉的機(jī)器人的邏輯是分塊的。導(dǎo)航、走路、抓取,它們被切分成互不干擾的模塊。
2025 年的機(jī)器人,基本上可以大概被劃分為兩類。一類關(guān)注全身控制的機(jī)器人的,會(huì)跳舞的機(jī)器人,本質(zhì)上是在執(zhí)行一段死板的程序,即使中途撞到障礙物,它也會(huì)機(jī)械地跳完。
而另一類關(guān)注靈巧操作的機(jī)器人,也就是會(huì)收碗的機(jī)器人,通常只是上半身在忙碌,下半身像個(gè)死板的底座,被輪子負(fù)載,僅僅負(fù)責(zé)位移。
但在 Helix 02 的突破點(diǎn)是,在這個(gè)模型中,運(yùn)動(dòng)與操作被徹底統(tǒng)一,一統(tǒng)了兩類機(jī)器人的問(wèn)題。
Figure 的工程師并沒(méi)有預(yù)先訓(xùn)練它「如何用腳踢門(mén)」。這個(gè)動(dòng)作是機(jī)器人基于內(nèi)部知識(shí)的自發(fā)選擇——它可能是判斷到了彎腰太低對(duì)于重心不方便,于是根據(jù)當(dāng)前的物理環(huán)境,自主判斷出「用腳踢」是最高效的輔助手段。
2025 年,F(xiàn)igure 已經(jīng)官宣估值到達(dá) 390 億美金,比宇樹(shù)傳聞的 1000 億人民幣上市估值仍要高 3 倍。
這家全球最貴的人形機(jī)器人公司,研究出來(lái)的用腳關(guān)洗碗機(jī),可能會(huì)終于解決大家對(duì)于跳舞的機(jī)器人不會(huì)干活的吐槽,引領(lǐng)下一波機(jī)器人風(fēng)潮。
01 統(tǒng)一人形機(jī)器人的運(yùn)動(dòng)和操控
此次,F(xiàn)igure 發(fā)布的是它的新模型,Helix 02。
模型本身是端到端的設(shè)計(jì)。
頭部的全景攝像頭、掌心的近距離相機(jī)、指尖的觸覺(jué)傳感器,全身的關(guān)節(jié)運(yùn)動(dòng)狀態(tài)全被喂進(jìn)神經(jīng)網(wǎng)絡(luò)。
而輸出則是一個(gè)完整的全身動(dòng)作包。在這個(gè)瞬時(shí)的決策里,包含了腿部的支撐力、軀干的平衡傾角、手臂的延展路徑,以及每一根手指的捏合力度。
一個(gè)模型,就可以控制 Figure 03 的 30 個(gè)自由度的機(jī)器人本體。
目前主流的 VLA 模型,大多依賴于向機(jī)器人喂入海量數(shù)據(jù),比如通過(guò)人類遙控機(jī)器人收碗的數(shù)據(jù),來(lái)訓(xùn)練它學(xué)會(huì)收碗這項(xiàng)技能。
而相比之下,Helix 02 的神經(jīng)網(wǎng)絡(luò)不再去學(xué)習(xí)「如何做一個(gè)收碗的任務(wù)」,它更多學(xué)習(xí)的是「人類運(yùn)動(dòng)的一般規(guī)律」。Helix 02 學(xué)習(xí)的是超過(guò) 1000 小時(shí)的重定向到關(guān)節(jié)的人類全身動(dòng)作數(shù)據(jù),借此獲得了一種通用的物理先驗(yàn)。
除了用腳頂洗碗機(jī)門(mén),還有一個(gè)動(dòng)作也受到了大家的廣泛關(guān)注。
在拿完?yáng)|西關(guān)抽屜的時(shí)候,Helix 02 的模型直接選擇了用胯頂了一下抽屜,把抽屜門(mén)關(guān)上。
Figure 自己在博客里解釋了為什么要做這樣一套運(yùn)動(dòng)和操控結(jié)合的系統(tǒng):
移動(dòng)操控,即機(jī)器人將移動(dòng)和操控物體作為一種單一、連續(xù)的行為的能力,一直是機(jī)器人領(lǐng)域最難解決的問(wèn)題之一。這并非因?yàn)閱为?dú)實(shí)現(xiàn)這兩項(xiàng)能力有多么困難,而是因?yàn)橥瑫r(shí)實(shí)現(xiàn)這兩項(xiàng)能力難以進(jìn)行清晰的分解。舉起重物時(shí),機(jī)器人的平衡會(huì)發(fā)生變化;向前邁步時(shí),機(jī)器人的觸及范圍也會(huì)發(fā)生變化。手臂和腿會(huì)不斷地相互制約 。
人形機(jī)器人已經(jīng)展現(xiàn)出令人印象深刻的短期行為,例如跳躍、跳舞和瑜伽,但幾乎所有機(jī)器人都存在一個(gè)局限性:它們并非真正可控。大多數(shù)系統(tǒng)只是在離線狀態(tài)下重現(xiàn)預(yù)先規(guī)劃的動(dòng)作,且反饋有限。如果物體發(fā)生移動(dòng)或接觸情況發(fā)生變化,行為就會(huì)崩潰。
傳統(tǒng)機(jī)器人通過(guò)將運(yùn)動(dòng)和操作分離到不同的控制器中,并用狀態(tài)機(jī)將它們連接起來(lái)來(lái)解決這個(gè)問(wèn)題:行走、停止、穩(wěn)定、伸展、抓取、再次行走。這種切換方式速度慢、難以判斷,而且不自然。
真正的自主需要一些根本不同的東西:一個(gè)能夠同時(shí)對(duì)整個(gè)身體進(jìn)行推理的單一學(xué)習(xí)系統(tǒng)。一個(gè)能夠持續(xù)感知、決策和行動(dòng)的系統(tǒng)——邊走邊搬運(yùn),邊伸手取物邊調(diào)整平衡,并實(shí)時(shí)糾正錯(cuò)誤。
事實(shí)上,這種思路與 Figure 早期開(kāi)發(fā) Helix 第一代模型時(shí)一脈相承。當(dāng)時(shí) Helix 證明了單個(gè)神經(jīng)網(wǎng)絡(luò)可以控制機(jī)器人的整個(gè)上半身,而不只是局限在機(jī)械臂或夾爪上。
但在那個(gè)階段,這種能力依然存在局限。因?yàn)闄C(jī)器人的底座是固定的或者獨(dú)立的,它只能在有限的范圍內(nèi)活動(dòng)。
如今 Helix 02 的出現(xiàn),將端到端的控制擴(kuò)展到了機(jī)器人的每一個(gè)關(guān)節(jié),實(shí)現(xiàn)了真正的全身自主。
而且在這段未剪輯的視頻中,Helix 02 連續(xù)執(zhí)行了 61 個(gè)運(yùn)動(dòng)操作動(dòng)作,甚至展示了彎腰操作這種既考驗(yàn)平衡性,又考驗(yàn)操作性的動(dòng)作,顯示 Helix 02 已經(jīng)在這套架構(gòu)中取得了一定的成功。
而作為觀眾直觀地去看時(shí),當(dāng)運(yùn)動(dòng)和操控結(jié)合進(jìn)了一個(gè)模型,機(jī)器人更像是開(kāi)始擁有了某種基礎(chǔ)的身體意識(shí),開(kāi)始終于懂得「我手里抱著東西呢,用胯頂一下抽屜吧」這種之前人類才具有的「全身即工具」的直覺(jué)。
02 神秘的 system 0
之所以能實(shí)現(xiàn)這樣的統(tǒng)一,部分原因是 Helix 02 的架構(gòu)里,此次塞進(jìn)了一個(gè)極其關(guān)鍵的底層組件:System 0。
這是一個(gè)專門(mén)負(fù)責(zé)物理本能的神經(jīng)網(wǎng)絡(luò)。在它出現(xiàn)之前,工程師們必須手動(dòng)編寫(xiě)復(fù)雜的物理方程來(lái)維持機(jī)器人的平衡。Figure 這一次干脆刪掉了 109,504 行手工編寫(xiě)的 C++ 代碼,用一個(gè)單一的神經(jīng)網(wǎng)絡(luò)先驗(yàn)取而代之。
System 0 的核心任務(wù)只有三個(gè):平衡、接觸和全身協(xié)調(diào)。它的運(yùn)行頻率高達(dá) 1000 赫茲,這意味著它每秒鐘要向電機(jī)下達(dá) 1000 次指令。這種極高的處理速度,讓它能夠像人類的脊髓反射一樣,在意識(shí)到「要摔倒了」之前,就已經(jīng)完成了肌肉力量的對(duì)沖。
更有趣的地方在于 System 0 的訓(xùn)練方式。工程師們并沒(méi)有為行走、轉(zhuǎn)身或者蹲下分別設(shè)計(jì)復(fù)雜的獎(jiǎng)勵(lì)函數(shù),而是直接給模型喂了超過(guò) 1000 小時(shí)的人類全身動(dòng)作數(shù)據(jù),重定向到關(guān)節(jié)上,在仿真中進(jìn)行了強(qiáng)化學(xué)習(xí)的訓(xùn)練。
在學(xué)習(xí)如何「復(fù)現(xiàn)人類動(dòng)作」的過(guò)程中,模型自發(fā)地學(xué)會(huì)了如何協(xié)調(diào)全身的力矩,如何在各種姿勢(shì)下維持重心。這就是為什么 Helix 02 的動(dòng)作看起來(lái)不再僵硬,因?yàn)樗辉偈前凑展皆谟?jì)算平衡,而是在復(fù)刻一種被數(shù)據(jù)驗(yàn)證過(guò)的「人類直覺(jué)」。
在 Helix 02 這種三層架構(gòu)里,每一層都有明確的職責(zé)分工。處于最高層的是 System 2,它像是一個(gè)冷靜的指揮官,負(fù)責(zé)語(yǔ)義推理。它不再需要操心機(jī)器人怎么邁步,而是直接下達(dá)模糊的目標(biāo)指令,比如「走到洗碗機(jī)那并打開(kāi)它」或者「把碗拿到柜臺(tái)上去」。
中間層 System 1 則是敏捷的執(zhí)行經(jīng)理。它以 200 赫茲的頻率運(yùn)行,負(fù)責(zé)把眼睛看到的像素和指揮官的目標(biāo),轉(zhuǎn)化為全身上下 30 個(gè)關(guān)節(jié)的運(yùn)動(dòng)目標(biāo)。
最后,這些目標(biāo)被交到 System 0 手里,轉(zhuǎn)化為真實(shí)的扭矩輸出,出現(xiàn)誤差也可以獲得高頻的修改。
事實(shí)上,關(guān)于這種模型的討論,在 2025 年就已經(jīng)成為機(jī)器人圈子的前沿關(guān)注點(diǎn)。
具身智能投資人筆盒提到,之前英偉達(dá)發(fā)布的 Sonic 項(xiàng)目、西湖大學(xué)的身外化身系統(tǒng),都展示了類似的邏輯。英偉達(dá)的 Sonic 項(xiàng)目當(dāng)時(shí)用的 700 小時(shí)的數(shù)據(jù)。再往前,這種技術(shù)路線可以一路追溯到學(xué)術(shù)界的經(jīng)典工作,比如 DeepMimic 和 BeyondMimic 系列。
在 2026 年的 CES 上,Sharpa 也展示過(guò)類似 CraftNet 的工作,核心也是 System 1 與 System 0 的耦合。
Sharpa 提出的「最后一毫米智能(LMI)」,就是利用 System 0 在接觸物體的瞬間,通過(guò)觸覺(jué)與力反饋進(jìn)行實(shí)時(shí)精修。System 0 的運(yùn)行頻率約為 100 Hz,這讓機(jī)器人能夠像人手一樣,感知阻力、滑動(dòng)并進(jìn)行實(shí)時(shí)修正。
2026 年,system 0 為機(jī)器人帶來(lái)的驚喜可能會(huì)更多。
03 最貴的人形機(jī)器人公司
除了全身自主這一重頭戲,Helix 02 還有不少其他看點(diǎn):
比如借助 Figure 03 的硬件底座,Helix 02 真正觸達(dá)了多指靈巧操作的邊界。以前的人形機(jī)器人往往在「自身遮擋」面前束手無(wú)策——一旦身體擋住了頭部攝像頭的視線,機(jī)器人就會(huì)變成瞎子。但 Figure 在每一只手的掌心都塞進(jìn)了一枚廣角攝像頭,這給了它一種「手心長(zhǎng)眼」的上帝視角。
配合每個(gè)指尖能感知 3 克微力的觸覺(jué)傳感器,它現(xiàn)在能完成極其細(xì)碎的動(dòng)作:從雜亂的藥盒里摳出一片單薄的藥丸,或者在注射器上精準(zhǔn)地推出 5 毫升液體。這種精細(xì)度意味著機(jī)器人不再只能干搬運(yùn)箱子這種體力活,它開(kāi)始具備了處理復(fù)雜工業(yè)零件、甚至是家庭護(hù)理的潛能。
在硅谷,F(xiàn)igure 的機(jī)器人是一個(gè)相對(duì)神秘的存在,他們很少出現(xiàn)在熱鬧的展會(huì)現(xiàn)場(chǎng)。
但在資本市場(chǎng),它的聲浪卻是海嘯級(jí)的。2025 年 9 月,F(xiàn)igure 完成了超過(guò) 10 億美元的 C 輪融資,估值飆升至 390 億美元。
Figure 的創(chuàng)始人布雷特·阿德科克(Brett Adcock)是一個(gè)極其硬核的連環(huán)創(chuàng)業(yè)者。他在 2022 年創(chuàng)立公司時(shí),并沒(méi)有先去忽悠風(fēng)投,而是直接從兜里掏出了 1 億美元的個(gè)人資金砸了進(jìn)去。這種「帶資進(jìn)組」的底氣,讓 Figure 從一開(kāi)始就保持了極高的獨(dú)立性。
一個(gè)最典型的細(xì)節(jié)是,F(xiàn)igure 曾經(jīng)是 OpenAI 在具身智能領(lǐng)域的頭號(hào)合作伙伴,但這種合作關(guān)系在 2025 年 2 月戛然而止。
分手的理由就是 Figure 宣稱 Figure 發(fā)現(xiàn)自己搞出來(lái)的 Helix 模型已經(jīng)足夠強(qiáng)悍。它不再需要一個(gè)遠(yuǎn)在云端的通用大模型來(lái)指揮自己,而是要構(gòu)建一套屬于物理實(shí)體的、像素到扭矩的內(nèi)生邏輯。這種權(quán)力的收回,標(biāo)志著 Figure 正式從「硬件載體」進(jìn)化成了「大腦、小腦、身體」三位一體的完全體。
阿德科克曾公開(kāi)表示,F(xiàn)igure 的終極目標(biāo)是讓機(jī)器人像人類一樣進(jìn)入每一個(gè)未知的家庭環(huán)境,執(zhí)行那種不需要監(jiān)督的、跨時(shí)天的復(fù)雜家務(wù)。在更遠(yuǎn)的愿景里,這些機(jī)器人還將承擔(dān)起老年人護(hù)理,甚至是前往其他星球進(jìn)行太空探索的重任。
第一代的 Figure 機(jī)器人就曾經(jīng)進(jìn)寶馬工廠打工,而且有趣的是還是公司還公布了它的退休故事:在那里的 11 個(gè)月里,它協(xié)助組裝了超過(guò) 3 萬(wàn)輛寶馬 X3,行走了 200 多英里。
而 2025 年的新融資之后,阿德科克設(shè)計(jì)了一個(gè)極其宏大的「Master Plan」:他要在四年內(nèi)通過(guò)自建的 BotQ 工廠生產(chǎn) 10 萬(wàn)臺(tái)機(jī)器人。
當(dāng)同一個(gè)機(jī)器人不止能跳舞,同時(shí)用同樣的靈活性學(xué)會(huì)了用腳關(guān)門(mén),學(xué)會(huì)了從藥盒里摳出藥片,市場(chǎng)前景可能比單獨(dú)會(huì)跳舞的機(jī)器人或者輪式的雙臂機(jī)器人大很多。
起碼包括英偉達(dá)在內(nèi)的不少資本,已經(jīng)在 Figure 身上下注了。











