在機(jī)器人技術(shù)競爭日益激烈的當(dāng)下,OpenAI正以獨(dú)特的方式悄然布局人形機(jī)器人領(lǐng)域。與特斯拉、Figure等企業(yè)高調(diào)展示整機(jī)不同,OpenAI選擇了一條從底層技術(shù)切入的路徑——通過大規(guī)模數(shù)據(jù)采集構(gòu)建物理世界動作模型。
位于舊金山的秘密實(shí)驗(yàn)室里,約百名合同工正以三班倒的方式全天候運(yùn)轉(zhuǎn)。他們通過3D打印的GELLO控制器遠(yuǎn)程操控德國Franka機(jī)械臂,執(zhí)行著看似簡單的家庭任務(wù):將橡皮鴨精準(zhǔn)放入杯子、把面包片送入烤面包機(jī)、完成衣物折疊等。這些動作在人類眼中輕而易舉,卻是機(jī)器人訓(xùn)練中最具挑戰(zhàn)性的標(biāo)準(zhǔn)化難題。實(shí)驗(yàn)室的攝像頭陣列同步記錄著人類操作與機(jī)械臂動作的雙重軌跡,系統(tǒng)自動篩選出"有效工時(shí)"用于模型訓(xùn)練——這種模式與OpenAI早期通過人工標(biāo)注構(gòu)建語言大模型的方法如出一轍,只是將數(shù)據(jù)維度從文本擴(kuò)展到了物理動作。
技術(shù)路徑的選擇折射出戰(zhàn)略轉(zhuǎn)型。早期OpenAI曾嘗試用強(qiáng)化學(xué)習(xí)讓機(jī)器人在試錯(cuò)中進(jìn)化,但現(xiàn)實(shí)世界的復(fù)雜性導(dǎo)致這種方法的成本呈指數(shù)級增長。如今團(tuán)隊(duì)轉(zhuǎn)向"數(shù)據(jù)驅(qū)動"路線,認(rèn)為真正的瓶頸不在于機(jī)器人外形,而在于如何讓系統(tǒng)穩(wěn)定復(fù)現(xiàn)真實(shí)場景任務(wù)。這種判斷推動他們將資源集中在機(jī)械臂而非完整人形機(jī)器人上——"機(jī)械臂+低成本控制器"的組合不僅降低了硬件成本,更建立了人類動作與機(jī)器人執(zhí)行間的精確映射關(guān)系。
實(shí)驗(yàn)室的擴(kuò)張速度令人矚目。成立不到一年,團(tuán)隊(duì)規(guī)模已擴(kuò)大數(shù)倍,并計(jì)劃在加州里士滿設(shè)立第二個(gè)基地。內(nèi)部人士透露,雖然硬件項(xiàng)目尚未進(jìn)入公司核心戰(zhàn)略層,但OpenAI已開始接觸美國本土制造伙伴,業(yè)務(wù)范圍覆蓋消費(fèi)級設(shè)備、機(jī)器人及數(shù)據(jù)中心等多個(gè)領(lǐng)域。這種布局暗示著更深層的戰(zhàn)略考量:通過構(gòu)建物理世界動作數(shù)據(jù)庫,為具身智能的爆發(fā)儲備"燃料"。
當(dāng)機(jī)器人具備可靠執(zhí)行能力時(shí),OpenAI在語言理解、多模態(tài)交互等領(lǐng)域的技術(shù)積累將產(chǎn)生質(zhì)變。認(rèn)知系統(tǒng)與動作模型的融合,可能催生出真正理解物理世界的"機(jī)器人大腦",使機(jī)器從被動執(zhí)行指令升級為主動參與人類生活。這種耐心的基礎(chǔ)建設(shè),正在為下一個(gè)技術(shù)突破點(diǎn)埋下伏筆。











