岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

蘋果聯合中國人民大學發布 VSSFlow 模型:無聲視頻 AI 同步生成音效與配音

   時間:2026-02-10 16:33:17 來源:IT之家編輯:快訊 IP:北京 發表評論無障礙通道
 

2 月 10 日消息,科技媒體 9to5Mac 昨日(2 月 9 日)發布博文,報道稱蘋果公司攜手中國人民大學(簡稱人大),推出 VSSFlow 新型 AI 模型,突破了傳統音頻生成技術的瓶頸,僅需單一系統即可從無聲視頻中同時生成逼真的環境音效與人類語音。

該模型的核心能力在于“化靜為動”,能夠直接處理無聲視頻數據,在單一系統的框架下,同步生成與畫面高度匹配的環境音效以及精準的語音對話。該成果不僅解決了過去音頻生成模型功能單一的問題,更在生成質量上達到了行業領先水平。

援引博文介紹,在 VSSFlow 問世之前,行業內的模型往往存在嚴重的偏科現象:視頻轉聲音模型(V2S)難以生成清晰的語音,而文本轉語音模型(TTS)又無法處理復雜的環境噪音。

傳統的解決方案通常是將兩者分階段訓練,這不僅增加了系統的復雜性,還常因任務沖突導致性能下降。VSSFlow 則另辟蹊徑,采用了 10 層架構設計并引入“流匹配”技術,讓模型自主學習如何從隨機噪聲中,重構出目標聲音信號。

研究團隊在訓練過程中發現了一個令人驚喜的現象:聯合訓練不僅沒有導致任務干擾,反而產生了“互助效應”。即語音數據的訓練提升了音效生成的質量,而音效數據的加入也優化了語音的表現。

團隊為了實現這一效果,向模型投喂了混合數據,包括配有環境音的視頻、配有字幕的說話視頻以及純文本轉語音數據,并利用合成樣本微調模型,讓其學會同時輸出背景音與人聲。

在實際運行中,VSSFlow 以每秒 10 幀的頻率從視頻中提取視覺線索來塑造環境音效,同時依據文本腳本精確引導語音生成。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 欧美性极品xxxx做受 | 鲁大师影院入口在线观看 | 伊人春色在线观看 | 人人搞人人干 | 性一交一乱一精一晶 | 国产日韩视频在线观看 | 黄色片子免费看 | 销魂奶水汁系列小说 | 99色在线 | 亚洲三级a| 午夜在线观看视频 | 成人久久久精品乱码一区二区三区 | 男女碰碰碰 | 亚欧在线视频 | 在线观看免费黄色网址 | 国产久草视频 | 亚洲午夜精品在线 | 国内自拍真实伦在线观看 | 日日日日日 | 丁香婷婷激情 | 国产在线观看免费网站 | 国产又粗又猛又爽又黄视频 | 黄色片毛片 | 九九欧美| 干日本少妇 | 日本中文在线 | 久久久一区二区三区四区 | 天堂福利在线 | 在线看免费av | 人人色视频| 四虎影视永久免费 | 欧美资源网 | 在线观看国产视频 | 国产日本在线观看 | 国产无精乱码一区二区三区 | 精品免费在线视频 | 精品欧美久久 | av在线免费观看网站 | 成人亚洲一区 | 久久机热这里只有精品 | 国产一二三级 |