滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

宇樹開源多模態(tài)視覺語言大模型UnifoLM-VLA-0

時間：2026-01-29 22:01:02 來源：鳳凰網(wǎng)科技編輯：快訊 IP：北京 發(fā)表評論無障礙通道

鳳凰網(wǎng)科技訊 1月29日，機器人公司宇樹科技宣布開源其視覺-語言-動作（VLA）大模型 UnifoLM-VLA-0。該模型旨在解決傳統(tǒng)視覺語言大模型（VLM）在物理交互中的局限，通過針對性的預訓練，使之從圖文理解能力進化成具備物理常識的“具身大腦”。

據(jù)官方介紹，UnifoLM-VLA-0 是 UnifoLM 系列下專門面向通用人形機器人操作的模型。其基于開源的 Qwen2.5-VL-7B 模型構建，使用了覆蓋通用與機器人場景的多任務數(shù)據(jù)集進行持續(xù)預訓練，以提升模型對幾何空間與語義邏輯的對齊能力。

模型的核心突破在于針對操作任務的高要求，深度融合了文本指令與2D/3D空間細節(jié)，并構建了全鏈路動力學預測數(shù)據(jù)以增強任務泛化性。特別地，宇樹在模型架構上集成了動作預測頭，并對開源數(shù)據(jù)集進行了系統(tǒng)化清洗，最終僅利用約340小時的真機數(shù)據(jù)，結合動作分塊預測與動力學約束，實現(xiàn)了對復雜動作序列的統(tǒng)一建模與長時序規(guī)劃。

評估結果顯示，該模型在多個空間理解基準上的能力較基礎模型有顯著提升，并在“no thinking”模式下可比肩 Gemini-Robotics-ER 1.5。在 LIBERO 仿真基準測試中，其多任務模型也取得了接近最優(yōu)的性能。

在真機驗證環(huán)節(jié)，UnifoLM-VLA-0 在宇樹 G1 人形機器人平臺上，僅憑單一策略網(wǎng)絡即可高質(zhì)量完成開閉抽屜、插拔插頭、抓取放置等12類復雜的操作任務。官方稱，即使在外部擾動條件下，模型也表現(xiàn)出良好的執(zhí)行魯棒性與抗干擾能力。

目前，該模型的項目主頁與開源代碼已在 GitHub 平臺公布，供開發(fā)者與研究人員獲取。

02-22

三星 Galaxy S26 系列引入 Perplexity AI，開啟智能手機新紀元！

02-22

三星Galaxy S26系列手機將深度整合Perplexity AI

02-22

三星Galaxy S26 Ultra宣傳材料曝光

02-22

馬修·麥康納警告：AI或?qū)⑷〈輪T，沖擊奧斯卡

02-22

OpenAI CEO奧爾特曼駁斥ChatGPT耗水相關謠言：完全不符合事實

02-22

從先行者到中式機器人崛起：技術路線抉擇如何改寫全球機器人格局

02-22

ChatGPT消費版使用新趨勢：個人任務漸增，工作場景漸減影響幾何？

02-22

三星Galaxy S26系列攜手Perplexity AI，打造開放式多智能體生態(tài)新體驗

02-22

三星Galaxy S26 Ultra宣傳材料流出：相機電池配置揭曉，多項新特性亮相

02-22

三星Galaxy S26 Ultra宣傳材料流出：相機電池配置揭曉隱私屏等亮點引關注

02-22

OpenAI CEO奧爾特曼：ChatGPT耗水謠言不實能效或已追平人類

02-22

宇樹CEO王興興談機器人：技術進步快，大規(guī)模應用或3至10年到來

此前，春晚《武BOT》節(jié)目中，一臺宇樹機器人打著醉拳“摔倒”在地，“是故意的還是不小心的？”對此宇樹CEO王興興給出回應：“劇情需要，打醉拳的時候有要倒不倒的狀態(tài)，如果機器人倒了以后再自己站起來，會非常帥，…

02-22

春晚科技閃耀：機器人舞動、AI賦能，共繪創(chuàng)新發(fā)展新畫卷

據(jù)總臺編務會議成員姜文波介紹，今年的機器人深度融合了高精度激光即時定位與地圖構建、集群協(xié)同控制、實時語音交互等前沿人工智能技術。在武術、語言類節(jié)目中，它們以集群化編隊精準完成富有層次的隊形變換及高難度動作表…

02-22

千問“一句話下單”引爆搶購潮，運城小店春節(jié)狂攬5000單生意火！

02-22

點擊查看更多 +

全站最新

春晚機器人成新寵：“仿生蔡明”贈真身，“熊貓款”高價落槌引熱議

比亞迪春節(jié)廣告不提車只談溫情，暖心文案讓游子倍感慰藉

設施升級充電快智慧運維服務暖——春運新能源車充電保障再升級

比亞迪車型閃耀《驚蟄無聲》，國產(chǎn)汽車實力出圈成明星出行新寵兒

2026年選電動車別糾結！10寸電機經(jīng)濟實用，12寸電機動力澎湃怎么選？

磷酸鐵鋰與三元鋰：誰更適合家用？誰又更受高端車青睞？

熱門內(nèi)容

本欄最新

中國芯片實力獲認可：豐田鈴木等外企選用，成本品質(zhì)雙重優(yōu)勢凸顯

黃仁勛預熱GTC 2026：將推“世界前所未見”芯片突破技術極限引期待

黃仁勛預熱GTC 2026：將推“世界未見”芯片突破技術極限引期待

黃仁勛預熱GTC 2026：將推“世界前所未見”芯片突破技術極限再領跑

黃仁勛預熱GTC 2026：全新芯片將至英偉達突破極限再領跑AI算力

從對話到實干：豆包大模型2.0化身全能助手，多領域展現(xiàn)驚人動手能力

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

宇樹開源多模態(tài)視覺語言大模型UnifoLM-VLA-0