近日,具身智能領(lǐng)域迎來重要突破——智象未來(HiDream.ai)與諾亦騰機(jī)器人(Noitom Robotics)正式簽署戰(zhàn)略合作協(xié)議,雙方將通過技術(shù)融合探索具身智能訓(xùn)練數(shù)據(jù)的規(guī)模化生成新路徑。此次合作聚焦于解決行業(yè)核心痛點(diǎn):如何突破多模態(tài)數(shù)據(jù)獲取成本高、質(zhì)量參差不齊的瓶頸,為具身智能模型提供符合物理世界規(guī)律的"燃料"。
具身智能的快速發(fā)展對訓(xùn)練數(shù)據(jù)提出嚴(yán)苛要求。與傳統(tǒng)大語言模型依賴文本數(shù)據(jù)不同,具身智能需要整合視覺、運(yùn)動、觸覺等多維度信息,傳統(tǒng)采集方式不僅成本高昂,且難以覆蓋復(fù)雜場景。隨著產(chǎn)業(yè)進(jìn)入爆發(fā)期,訓(xùn)練數(shù)據(jù)需求正從"小規(guī)模演示"轉(zhuǎn)向"大規(guī)模工程化交付",數(shù)據(jù)獲取能力已成為決定系統(tǒng)性能的關(guān)鍵因素。據(jù)行業(yè)預(yù)測,未來三年具身智能數(shù)據(jù)市場規(guī)模將突破百億元,但高質(zhì)量數(shù)據(jù)供給不足的問題亟待解決。
合作雙方構(gòu)建了"真實(shí)+生成"的互補(bǔ)模式。諾亦騰機(jī)器人憑借其高精度人體動作捕捉系統(tǒng),已建立覆蓋全球的物理數(shù)據(jù)采集網(wǎng)絡(luò),其設(shè)備可捕捉毫米級運(yùn)動細(xì)節(jié),為合作提供真實(shí)世界的基礎(chǔ)數(shù)據(jù)支撐。智象未來則通過自研的多模態(tài)大模型,將采集到的原始傳感數(shù)據(jù)進(jìn)行百倍級精細(xì)化放大,通過可控視頻生成技術(shù)實(shí)現(xiàn)動作指令與視覺場景的深度融合。這種技術(shù)組合使生成數(shù)據(jù)在場景復(fù)雜度、光影變化等維度達(dá)到行業(yè)領(lǐng)先水平,同時確保每幀視頻與底層操作數(shù)據(jù)的精準(zhǔn)對應(yīng)。
在技術(shù)實(shí)現(xiàn)層面,雙方突破了傳統(tǒng)數(shù)據(jù)生成的局限。智象未來CTO姚霆博士指出:"通用視頻模型容易產(chǎn)生物理不一致性,我們通過多模態(tài)對齊技術(shù),使生成數(shù)據(jù)在保持藝術(shù)表現(xiàn)力的同時,嚴(yán)格符合物理規(guī)律。"諾亦騰首席科學(xué)家韓磊博士則強(qiáng)調(diào):"單一數(shù)據(jù)源無法支撐模型在復(fù)雜環(huán)境中的泛化能力,真實(shí)數(shù)據(jù)與生成數(shù)據(jù)的融合將構(gòu)建起兼具真實(shí)性與多樣性的訓(xùn)練體系。"這種創(chuàng)新模式使數(shù)據(jù)生成效率提升30倍以上,預(yù)計年內(nèi)將產(chǎn)出數(shù)萬小時標(biāo)準(zhǔn)化訓(xùn)練數(shù)據(jù)。
合作成果已顯現(xiàn)初步價值。在機(jī)器人抓取任務(wù)測試中,使用融合數(shù)據(jù)的模型在復(fù)雜場景下的成功率提升42%,且訓(xùn)練周期縮短60%。某頭部人形機(jī)器人企業(yè)負(fù)責(zé)人表示:"這種高質(zhì)量數(shù)據(jù)供給模式解決了我們的燃眉之急,使模型迭代速度提升數(shù)倍。"目前,雙方正聯(lián)合開發(fā)數(shù)據(jù)工程化平臺,通過自動化標(biāo)注、質(zhì)量評估等工具鏈,構(gòu)建從采集到交付的全流程標(biāo)準(zhǔn)化體系。
技術(shù)協(xié)同效應(yīng)持續(xù)放大。智象未來將開放其零樣本生成能力,協(xié)助諾亦騰擴(kuò)展數(shù)據(jù)維度;諾亦騰則通過其物理仿真平臺,為生成數(shù)據(jù)提供實(shí)時驗(yàn)證環(huán)境。這種"虛擬生成-物理驗(yàn)證"的閉環(huán)系統(tǒng),正在重塑具身智能的數(shù)據(jù)生產(chǎn)范式。據(jù)內(nèi)部人士透露,雙方已啟動下一代世界模型研發(fā),計劃通過視頻建模與動作預(yù)測的協(xié)同驅(qū)動,實(shí)現(xiàn)更高效的具身智能訓(xùn)練方案。
行業(yè)觀察家指出,此次合作標(biāo)志著具身智能進(jìn)入"數(shù)據(jù)工程化"新階段。當(dāng)算力、算法逐漸趨同,高質(zhì)量數(shù)據(jù)供給能力將成為企業(yè)核心競爭力。隨著5G、邊緣計算等技術(shù)的發(fā)展,實(shí)時數(shù)據(jù)采集與生成技術(shù)的融合或?qū)⒋呱碌漠a(chǎn)業(yè)生態(tài),推動具身智能向通用人工智能邁進(jìn)。











