岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

靈初智能領(lǐng)跑具身智能賽道!10萬小時(shí)人類數(shù)據(jù)助力,登頂MolmoSpaces全球榜單

   時(shí)間:2026-04-12 15:47:24 來源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

靈初智能近期提出的解決方案引發(fā)關(guān)注。其研發(fā)的PSI框架包含策略模型Psi-R2與世界模型Psi-W0,通過整合近10萬小時(shí)人類操作數(shù)據(jù),構(gòu)建了從人類技能到機(jī)器人執(zhí)行的全鏈條訓(xùn)練體系。Psi-R2負(fù)責(zé)解析任務(wù)邏輯,學(xué)習(xí)“如何完成任務(wù)”;Psi-W0則通過預(yù)測不同動作的后果,補(bǔ)充“其他可能性會怎樣”的推理能力。這一雙模型架構(gòu)突破了傳統(tǒng)方法對數(shù)據(jù)對齊的依賴,轉(zhuǎn)而采用“原始數(shù)據(jù)輸入、原始數(shù)據(jù)輸出”的直接映射策略,將人手關(guān)節(jié)運(yùn)動通過運(yùn)動學(xué)公式轉(zhuǎn)換為機(jī)械臂可執(zhí)行的指令,同時(shí)保留原始圖像信息以減少人為干預(yù)誤差。

人類數(shù)據(jù)與真機(jī)數(shù)據(jù)的融合是該方案的核心創(chuàng)新。靈初披露,其預(yù)訓(xùn)練數(shù)據(jù)集包含5417小時(shí)真機(jī)數(shù)據(jù)與95472小時(shí)人類數(shù)據(jù),覆蓋294種場景、4821類任務(wù)及1382種物體。相較于自動駕駛或語言模型領(lǐng)域可依賴的現(xiàn)成語料庫,機(jī)器人訓(xùn)練數(shù)據(jù)需從現(xiàn)實(shí)操作中“逐幀采集”。人類數(shù)據(jù)的優(yōu)勢在于其天然包含任務(wù)目標(biāo)、動作細(xì)節(jié)與時(shí)間節(jié)拍信息,例如手機(jī)裝配中的微小部件操作,其動作精度與速度均經(jīng)過長期實(shí)踐優(yōu)化,更貼近產(chǎn)業(yè)實(shí)際需求。實(shí)驗(yàn)表明,Psi-R2經(jīng)預(yù)訓(xùn)練后,僅需不到100條真機(jī)軌跡微調(diào),即可完成高精度任務(wù)如工業(yè)包裝與紙盒折疊。

世界模型Psi-W0的引入解決了策略模型的局限性。傳統(tǒng)方法僅能從成功軌跡中學(xué)習(xí),而Psi-W0通過動作條件型視頻預(yù)測機(jī)制,將動作作為生成條件,模擬不同動作下的場景變化。為增強(qiáng)模型對失敗的認(rèn)知,訓(xùn)練數(shù)據(jù)中特意混入約30%的失敗樣本,涵蓋專項(xiàng)采集、常規(guī)操作與推理過程中的錯(cuò)誤案例。這一設(shè)計(jì)使模型不僅能評估策略有效性,還可通過強(qiáng)化學(xué)習(xí)在虛擬環(huán)境中優(yōu)化人類動作到機(jī)器人動作的轉(zhuǎn)換。例如,在抓取任務(wù)中,Psi-W0可推演人類抓取動作在機(jī)器人動力學(xué)條件下的結(jié)果,若偏差過大則自動調(diào)整軌跡,直至符合執(zhí)行標(biāo)準(zhǔn)。

數(shù)據(jù)質(zhì)量而非數(shù)量成為訓(xùn)練效能的關(guān)鍵。靈初提出,高信噪比、精準(zhǔn)3D位姿與任務(wù)多樣性是衡量數(shù)據(jù)價(jià)值的核心指標(biāo)。在感知模態(tài)優(yōu)先級上,3D位姿精度遠(yuǎn)超2D圖像與觸覺信號,而觸覺數(shù)據(jù)雖難在機(jī)器人端規(guī)模化部署,卻可通過“掩碼訓(xùn)練”方式間接利用——即屏蔽真機(jī)數(shù)據(jù)中的觸覺通道,迫使模型預(yù)測接觸信號,從而提升對交互過程的預(yù)判能力。人類操作節(jié)拍接近機(jī)械臂物理極限的特性,使其數(shù)據(jù)在訓(xùn)練中更具產(chǎn)業(yè)適配性。例如,遙操作節(jié)拍通常僅為機(jī)械臂上限的60%-70%,而人類在常規(guī)作業(yè)中的操作速度可逼近設(shè)備極限。

為推動行業(yè)生態(tài)發(fā)展,靈初同步開源了1000小時(shí)人類操作數(shù)據(jù)集。該數(shù)據(jù)集分為高精度與大規(guī)模擴(kuò)展兩類:前者經(jīng)嚴(yán)格處理后軌跡與真機(jī)高度對齊,適用于精細(xì)任務(wù)訓(xùn)練;后者則通過可控精度擴(kuò)大數(shù)據(jù)覆蓋范圍,強(qiáng)化模型泛化能力。這一結(jié)構(gòu)設(shè)計(jì)與PSI框架形成閉環(huán),既保障操作精度,又拓展預(yù)訓(xùn)練邊界。在MolmoSpaces公開評測中,Psi-R2以顯著優(yōu)勢登頂總榜,超越具身大模型標(biāo)桿π與英偉達(dá)GEAR等主流方案,驗(yàn)證了其方法在真實(shí)世界任務(wù)中的有效性。

當(dāng)前,具身智能訓(xùn)練框架的競爭已從單一模型性能轉(zhuǎn)向系統(tǒng)化路徑設(shè)計(jì)。靈初的方案通過整合人類數(shù)據(jù)、雙模型架構(gòu)與強(qiáng)化學(xué)習(xí)優(yōu)化,構(gòu)建了無需依賴大規(guī)模真機(jī)遙操作的數(shù)據(jù)驅(qū)動訓(xùn)練路徑。這一路徑不僅降低了數(shù)據(jù)采集成本,更通過模擬反事實(shí)推理與虛擬調(diào)優(yōu),縮短了模型從實(shí)驗(yàn)室到工廠的落地周期。隨著1000小時(shí)開源數(shù)據(jù)集的釋放,行業(yè)或?qū)⒓铀傧颉叭祟愂痉?虛擬優(yōu)化-真機(jī)執(zhí)行”的新訓(xùn)練范式轉(zhuǎn)型。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 大伊人久久 | 日本在线观看网址 | 中文字幕国产专区 | 亚洲精品卡一卡二 | 免费一级特黄特色大片 | 妹妹的朋友在线 | 天天综合视频 | 日日夜夜精品 | 久久激情网 | 天天碰天天干 | 久久国产热 | 91视频在线 | 日韩经典一区二区三区 | 超碰夫妻 | 亚洲网视频 | 全部免费毛片在线播放 | 亚洲欧美国产另类 | 久久久午夜影院 | 伊人久久亚洲 | 色婷婷国产精品免 | 国产福利一区二区三区 | 欧美日韩免费做爰视频 | 黄色网址av | 天堂中文资源在线观看 | 日韩伊人网| 亚色中文 | 天堂av片 | 中文国产视频 | 亚洲特黄视频 | 99久久综合 | 在线观看天堂av | 先锋av资源站 | 国产精品视频www | 中文字幕免 | 欧美激情综合五月色丁香 | 国产精品色在线 | 国产精品9999 | 四虎永久免费在线 | 黄色片在线看 | 免费成人深夜夜视频 | 思思久久久 |