岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

告別“聲畫兩張皮”:通義實驗室發布 PrismAudio,讓 AI 聽懂視頻再配音

   時間:2026-03-25 04:11:10 來源:CHINAZ編輯:快訊 IP:北京 發表評論無障礙通道
 

在 AI 視頻生成大火的當下,“有畫無聲”或“聲不對位”一直是影響沉浸感的最后一道屏障。針對這一痛點,阿里通義實驗室近期推出了全新的視頻生成音頻(Video-to-Audio)框架——PrismAudio。該研究已被頂級 AI 會議 ICLR2026收錄,核心旨在為視頻自動配上嚴絲合縫的環境音效。

先思考再發聲:引入“思維鏈”的配音大師

傳統的配音模型通常是“直覺式”生成,容易出現馬蹄落在地上卻發出鳥叫,或者聲音比畫面慢半拍的尷尬情況。PrismAudio 的突破在于它學會了“先寫筆記,再發聲”。

分解式思維鏈: 模型在生成聲音前,會先分析視頻內容:畫面里有什么?聲音何時開始?音質是清脆還是低沉?聲源在左還是在右?

四重老師打分: 為了確保質量,研發團隊引入了強化學習,由四位“虛擬老師”從語義一致性、時序同步性、美學質量和空間準確性四個維度同時打分。這種多維度的反饋機制,解決了以往模型“顧此失彼”的頑疾。

輕量且高效:9秒視頻配音僅需0.6秒

除了聽得準,PrismAudio 還跑得極快。得益于自研的 Fast-GRPO 高效訓練算法,該模型在性能跨越式提升的同時,保持了極高的運行效率:

小身材大能量: 模型參數僅為5.18億,遠低于動輒數十億參數的同類模型。

極速響應: 生成一段9秒的高質量音頻僅需 0.63秒,幾乎做到了“即傳即得”。

行業觀察:環境音效的“真”時代

PrismAudio 的出現,不僅為影視后期、短視頻創作提供了強大的自動化工具,也為多目標生成任務提供了新的思路。當 AI 能夠精準權衡聲音的質感與空間感,未來的視頻創作將真正實現“所見即所聞”。

論文地址:arXiv:2511.18833

開源地址:https://prismaudio-project.github.io/

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 新黄色网址 | 国产无遮挡又黄又爽又色 | 成人亚洲一区 | 国产做爰xxxⅹ高潮视频12p | 伊人久久久 | 亚洲欧美日韩成人在线 | 亚洲精品91在线 | 国产在线观看你懂的 | 中文字幕国产精品 | 日韩黄色在线视频 | 久久久久久久久爱 | 免费在线观看成人 | 怡春院久久 | 夜夜躁天天躁很躁 | 国产精品一区二区三区在线免费观看 | 中文字幕在线观看视频免费 | 91n在线观看| 五月婷婷综合在线观看 | 国产精品久久免费观看 | 欧美一级片在线观看 | 免费黄视频在线观看 | 少妇av片在线观看 | 中文字幕欧美激情 | 青青草免费在线视频观看 | 激情黄页| 久久久久视频 | 欧美成人福利视频 | 国产67194| 国产精品50页 | 欧美日韩一区二区三区 | 91无套直看片红桃在线观看 | 亚洲美女色 | 五月天堂网 | 五月天婷婷丁香网 | 蜜臀av一区二区三区有限公司 | 青草在线观看 | 亚洲精品国产精华液 | 色视频在线播放 | 欧美在线激情视频 | av噜噜噜| 久久久久中文字幕亚洲精品 |