在馬年春晚舞臺(tái)上,一款名為“小蓋”的銀河通用機(jī)器人憑借一系列高難度操作驚艷全場。從精細(xì)地盤核桃、撿玻璃碎片、貨架取物,到生活化的疊衣服、串烤腸,它均展現(xiàn)出靈巧且自然的擬人動(dòng)作,徹底顛覆了人們對(duì)傳統(tǒng)機(jī)器人的認(rèn)知。與傳統(tǒng)機(jī)器人依賴預(yù)編程表演不同,“小蓋”的技能實(shí)現(xiàn)完全基于端到端自主感知、決策與執(zhí)行,其背后是銀河通用自主研發(fā)的“銀河星腦 AstraBrain”大模型在支撐。
“小蓋”的每一個(gè)動(dòng)作都凝聚著技術(shù)突破。以盤核桃為例,這一看似簡單的操作實(shí)則是靈巧操作領(lǐng)域的世界級(jí)難題。核桃表面不規(guī)則、重量分布不均,手掌握持時(shí)每根手指的受力點(diǎn)時(shí)刻變化,細(xì)微的力矩偏差都可能導(dǎo)致核桃滑落。為攻克這一難題,銀河通用在 AstraBrain 中構(gòu)建了靈巧手神經(jīng)動(dòng)力學(xué)小腦模型。機(jī)器人先在虛擬世界中接受海量訓(xùn)練,系統(tǒng)提供各種大小、重量的虛擬核桃供其試錯(cuò),練出適應(yīng)性強(qiáng)的“基礎(chǔ)盤法”;隨后在現(xiàn)實(shí)世界中積累“物理手感”,系統(tǒng)利用真實(shí)手感微調(diào)動(dòng)作指令,彌補(bǔ)虛擬與現(xiàn)實(shí)的誤差,最終實(shí)現(xiàn)流暢自然的盤核桃動(dòng)作。
撿玻璃碎片則是對(duì)感知與控制的雙重極限挑戰(zhàn)。透明物體在視覺上近乎“隱形”,傳統(tǒng)視覺算法難以準(zhǔn)確識(shí)別其三維輪廓和位姿,更無法判斷抓取點(diǎn)。AstraBrain 通過在仿真環(huán)境中生成海量不同厚度、碎裂形狀、光照條件下的玻璃碎片數(shù)據(jù),讓機(jī)器人“見過”各種透明形態(tài)。結(jié)合多模態(tài)感知融合技術(shù),“小蓋”能從微弱反光邊緣和陰影變化中“看見”玻璃,并精準(zhǔn)規(guī)劃抓取策略。模型賦予的力覺感知更使其能感知玻璃硬度和滑動(dòng)趨勢,以恰到好處的力度穩(wěn)穩(wěn)捏起碎片。
貨架取貨場景中,“小蓋”需從緊密排列的貨架層板間取下一瓶礦泉水,稍有不慎便會(huì)碰倒鄰品或抓取失敗。這要求機(jī)器人同時(shí)處理三重難題:精準(zhǔn)判斷水瓶位置、以擬人動(dòng)作伸手拿取且不碰倒周圍商品、靈巧操作緊密卡位的水瓶。AstraBrain 的強(qiáng)化學(xué)習(xí)框架讓“小蓋”在虛擬世界中經(jīng)歷億萬次“取貨試錯(cuò)”,通過自我博弈“悟”出最優(yōu)路徑——先扣住瓶蓋處,微微傾斜避讓鄰品,感知阻力后調(diào)整角度再穩(wěn)穩(wěn)抽出,整個(gè)過程實(shí)時(shí)決策,毫秒級(jí)響應(yīng)。
疊衣服被認(rèn)為是機(jī)器人操作領(lǐng)域的難題之一,因衣服是柔性物體,無固定形狀,每次拿起狀態(tài)不同。“小蓋”面對(duì)隨機(jī)擺放的 T 恤時(shí),需實(shí)時(shí)判斷布料褶皺狀態(tài)、預(yù)測折疊形態(tài)并規(guī)劃動(dòng)作序列。AstraBrain 在仿真環(huán)境中生成數(shù)萬計(jì)柔性物體變形數(shù)據(jù),讓機(jī)器人“見過”各種褶皺形態(tài)并學(xué)會(huì)推演最優(yōu)操作路徑。當(dāng)“小蓋”撫平衣角、精準(zhǔn)對(duì)折時(shí),實(shí)則是調(diào)用海量仿真經(jīng)驗(yàn)進(jìn)行實(shí)時(shí)決策。
串烤腸則是對(duì)雙手協(xié)同與工具操作能力的極限挑戰(zhàn)。“小蓋”需一手操控烤鉗烤制,另一手抓取簽子,雙手協(xié)作完成串烤腸并遞給明星。AstraBrain 的端到端大模型架構(gòu)讓機(jī)器人“大腦”同時(shí)處理雙手獨(dú)立指令流并實(shí)時(shí)調(diào)整,通過對(duì)海量仿真數(shù)據(jù)的學(xué)習(xí),“小蓋”理解了工具本質(zhì),將烤鉗視為手的延伸,能像人類一樣快速上手新工具。
“小蓋”動(dòng)作自然親切的背后,是“銀河星腦 AstraBrain”對(duì)人類動(dòng)作數(shù)據(jù)的大規(guī)模仿真生成機(jī)制。相比采集機(jī)器人生硬動(dòng)作,人類生活動(dòng)作海量且易獲取。結(jié)合仿真生成,能將人類動(dòng)作先驗(yàn)利用到極致,這是通往機(jī)器人大模型技術(shù)突破的關(guān)鍵方向。
AstraBrain 的核心哲學(xué)是讓機(jī)器人掌握通用能力,而非機(jī)械設(shè)定特定動(dòng)作。以貨架取物為例,其修煉過程分四步:第一步,僅需少量人類示范,機(jī)器人便能理解任務(wù)核心意圖;第二步,在仿真環(huán)境中自動(dòng)生成數(shù)萬種場景,機(jī)器人通過模仿學(xué)習(xí)掌握操作精髓;第三步,引入強(qiáng)化學(xué)習(xí)機(jī)制,讓機(jī)器人末端執(zhí)行器在虛擬世界中自我博弈,試錯(cuò)迭代出最優(yōu)路徑;第四步,在真實(shí)環(huán)境中進(jìn)行少量實(shí)際操作,收集真機(jī)數(shù)據(jù)微調(diào)模型。這一過程依托銀河通用的“銀河星坊”(AstraSynth)數(shù)據(jù)基建,該體系包括基石層(人類數(shù)據(jù))、中間層(仿真合成數(shù)據(jù))和塔尖層(真機(jī)實(shí)戰(zhàn)數(shù)據(jù)),形成虛實(shí)融合的數(shù)據(jù)金字塔,為機(jī)器人提供從任務(wù)認(rèn)知到實(shí)戰(zhàn)打磨的完整訓(xùn)練邏輯。











