滾動資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

SentiPulse攜手人大高瓴：開源交互式3D數(shù)字人框架SentiAvatar，領(lǐng)跑行業(yè)主流模型

時間：2026-04-08 16:15:54 來源：格隆匯編輯：快訊 IP：北京 發(fā)表評論無障礙通道

3D數(shù)字人行業(yè)已陷入發(fā)展怪圈：全行業(yè)的競爭維度，始終困在"視覺上夠不夠像人"的顏值內(nèi)卷里。但行業(yè)集體忽略的是，再精致的建模、再逼真的渲染，都無法成為用戶長期深度交互的核心理由。

真正卡住數(shù)字人產(chǎn)業(yè)發(fā)展天花板的，從來不是視覺層面的"不像人"，而是其始終未能構(gòu)建起與人類相似自然的表達(dá)能力和更流暢的動作。很多時候，數(shù)字人看似嘴在動、手在揮，肢體動作卻與對話語義完全脫鉤，面部表情和臺詞情緒徹底割裂，這種深入骨髓的機械感與違和感，直接斬斷了人與數(shù)字人之間建立情感聯(lián)結(jié)、實現(xiàn)深度交互的所有可能。

人類真實溝通中，超70%的信息與情緒都藏在非語言信號里，聳肩的無奈、挑眉的質(zhì)疑，這些細(xì)節(jié)才是對話的靈魂。但這背后是行業(yè)面臨的三個瓶頸：一是中文對話場景高質(zhì)量數(shù)據(jù)荒，覆蓋全身動作的高質(zhì)量數(shù)據(jù)集近乎空白；二是復(fù)合語義下動作漂移，面對融合情緒的復(fù)雜表達(dá)，模型語義理解能力急劇退化；三是音畫節(jié)奏錯位，動作機械生硬，與語音重音、停頓完全脫節(jié)。

這三道枷鎖，把數(shù)字人困在"預(yù)設(shè)腳本播放機器"的定位里，始終邁不開從"能說話"、"能動"到"懂交流"的關(guān)鍵一步。而SentiPulse(思維光譜)聯(lián)合中國人民大學(xué)高瓴人工智能學(xué)院推出的SentiAvatar交互式3D數(shù)字人框架，正是為打破這些瓶頸而來。面向全球開源的3D動作生成完整解決方案，讓數(shù)字人跳出預(yù)設(shè)動作桎梏，實現(xiàn)貼合語境與情緒的自然實時交互，真正告別"提線木偶"式交互。

國內(nèi)首個交互式3D數(shù)字人框架，讓3D數(shù)字人動作有"靈魂"

針對行業(yè)底層痛點，SentiAvatar打造了3D動作生成新范式。

在數(shù)據(jù)底座層，SuSuInterActs數(shù)據(jù)集圍繞單一角色SUSU(22歲，溫柔活潑，情感豐富)構(gòu)建。包含2.1萬段片段、37小時的多模態(tài)對話語料，涵蓋同步語音、行為標(biāo)注文本、全身動作與面部表情，填補中文高質(zhì)量數(shù)據(jù)的空白。

為打破場景限制，讓數(shù)字人交互擺脫"腳本化"，團隊在預(yù)訓(xùn)練階段引入了自研的Motion Foundation Model動作基礎(chǔ)模型，在200K+條異質(zhì)動作序列(約676小時)上訓(xùn)練通用運動先驗，讓數(shù)字人的能力遠(yuǎn)超對話場景本身。

此外，SentiAvatar創(chuàng)新提出plan-then-infill雙通道并行架構(gòu)，在動作生成時，將身體動作與面部表情分開處理，先規(guī)劃"做什么動作"，再插入"如何逐幀執(zhí)行"，讓整體動作生成效果更流暢。

具體而言，第一階段，LLM語義規(guī)劃器接收行為標(biāo)簽文本和稀疏音頻Token，輸出稀疏關(guān)鍵幀動作Token序列。為支持多輪流式連續(xù)生成，模型以前一句話的最后兩個關(guān)鍵幀音頻-動作Token對作為上下文前綴，從下一個關(guān)鍵幀位置續(xù)寫，實現(xiàn)無縫跨句過渡；第二階段，Body Infill Transformer在相鄰關(guān)鍵幀之間填入中間3幀，以逐幀 HuBERT連續(xù)特征(768維，20FPS)作為條件信號。模型采用5幀滑動窗口，首尾幀已知，預(yù)測中間3幀(12個動作Token)。推理時使用迭代置信度解碼策略(默認(rèn)6步)，逐步接受高置信度預(yù)測，避免一次性預(yù)測的質(zhì)量退化。

權(quán)威實驗結(jié)果顯示，SentiAvatar在SuSuInterActs和行業(yè)通用BEATv2兩個數(shù)據(jù)集上，多項核心指標(biāo)均達(dá)到當(dāng)前國際最優(yōu)水平(SOTA)，性能全面領(lǐng)跑行業(yè)主流模型。

在自建的SuSuInterActs測試集上，SentiAvatar的文本-動作檢索召回率R@1達(dá)到43.64%，幾乎是行業(yè)次優(yōu)基線的2倍；在跨數(shù)據(jù)集、跨語言的BEATv2評測集上，SentiAvatar以FGD 4.941、BC 8.078的成績，同時刷新兩項指標(biāo)的SOTA紀(jì)錄，超越此前行業(yè)最優(yōu)方案，充分驗證了模型的跨場景、跨語言泛化能力。

基于自研高質(zhì)量數(shù)據(jù)集、動作基礎(chǔ)模型與核心架構(gòu)，SentiAvatar實現(xiàn)了在0.3秒內(nèi)生成6秒動作序列，支持無限輪次的流式交互。這意味著數(shù)字人可以在實時對話中持續(xù)生成連貫的動作與表情，無需等待整句結(jié)束再批量處理，能直接解決數(shù)字人"交互卡頓"的問題。

構(gòu)建認(rèn)知-表達(dá)閉環(huán)，夯實數(shù)字人"交互底座"

SentiAvatar已正式上線GitHub開源平臺，面向全球科研機構(gòu)與開發(fā)者全面開放，相關(guān)技術(shù)報告也已同步發(fā)布于arXiv。開發(fā)者可基于這套開源框架，低成本打造專屬的3D數(shù)字人，也可拓展其在游戲交互、影視制作、機器人等領(lǐng)域的應(yīng)用。

當(dāng)數(shù)字人不再是冰冷機械的交互工具，它能讀懂你面部表情的隱喻并反饋同樣稀缺的情緒價值，變成能感知語境、理解情緒、主動表達(dá)的交互主體，下一代"數(shù)字生命"即將誕生。

更多>同類資訊

海南省國際文化交流中心簽署協(xié)議擬推動海南F1方程式賽車項目引進落地

04-08

西太平洋銀行：新西蘭聯(lián)儲可能在9月而非12月加息

04-08

液化氣主力合約觸及跌停

04-08

三星電子、SK海力士分別簽署氦氣長期采購合同

04-08

成長風(fēng)格有望重新占優(yōu)，南方基金鐘贇以“白馬+黑馬”策略捕捉成長機遇

04-08

法國2月貿(mào)易帳-57.78億歐元

04-08

紐約期銀大漲超8%

04-08

歐股集體大幅高開

04-08

SK海力士將向戴爾提供專為AI計算機設(shè)計的儲存解決方案

04-08

王毅將訪問朝鮮

04-08

福特因水撥故障在美國召回逾42萬輛汽車

04-08

西班牙首相：西班牙政府不會為那些先放火焚燒世界、后又拎著水桶現(xiàn)身的人喝彩

04-08

三星顯示器據(jù)悉成蘋果可折疊OLED獨家供應(yīng)商

04-08

中恒電氣：寧德時代擬41億元戰(zhàn)略入股控股股東公司將與其圍繞算電協(xié)同等領(lǐng)域開展合作

04-08

東莞農(nóng)商行5年追索扣罰績效薪酬超859萬 2025年人均薪酬降至25萬

04-08

點擊查看更多 +

全站最新

小米汽車答網(wǎng)友問第230集：SU7泊車新招 YU7功能預(yù)告空簧質(zhì)保等答疑

新款螢火蟲上市：動力升級價格親民，換電體系成制勝關(guān)鍵

活力登場！新鈴木雨燕SWIFT實車驚艷亮相，運動風(fēng)范引期待

榮威M7黑馬版官圖亮相，黑化設(shè)計賦能國民家轎格調(diào)新進階

哈弗新旗艦SUV來襲！30萬級硬派新能源，以“新物種”重塑品牌新高度

2026款一汽豐田亞洲龍星耀版登場：專屬黑化套件，17.98萬起售

熱門內(nèi)容

本欄最新

內(nèi)生穩(wěn)健、出海高增、消費破局：固生堂的三重增長邏輯與高分紅底氣

A股異動丨今日起"戴帽"，ST恒信20cm跌停，創(chuàng)2013年7月以來新低

首批醫(yī)保便捷支付推進地區(qū)名單公布

阿里巴巴直線拉升漲7%

AI視頻格局生變！神秘模型“Happy Horse”驚艷業(yè)界，中文在線、易點天下等集體走強

恒生科技指數(shù)漲超5%：美團、中芯國際大漲超10%，阿里漲超7%

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

SentiPulse攜手人大高瓴：開源交互式3D數(shù)字人框架SentiAvatar，領(lǐng)跑行業(yè)主流模型