岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 手機快報 > 正文內容

蘋果聯合人大發布VSSFlow模型：視頻AI同步生成配音

時間：2026-02-10 16:51:56 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

2 月 10 日消息，科技媒體 9to5Mac 昨日（2 月 9 日）發布博文，報道稱蘋果公司攜手中國人民大學（簡稱人大），推出 VSSFlow 新型 AI 模型，突破了傳統音頻生成技術的瓶頸，僅需單一系統即可從無聲視頻中同時生成逼真的環境音效與人類語音。

該模型的核心能力在于“化靜為動”，能夠直接處理無聲視頻數據，在單一系統的框架下，同步生成與畫面高度匹配的環境音效以及精準的語音對話。該成果不僅解決了過去音頻生成模型功能單一的問題，更在生成質量上達到了行業領先水平。

援引博文介紹，在 VSSFlow 問世之前，行業內的模型往往存在嚴重的偏科現象：視頻轉聲音模型（V2S）難以生成清晰的語音，而文本轉語音模型（TTS）又無法處理復雜的環境噪音。

傳統的解決方案通常是將兩者分階段訓練，這不僅增加了系統的復雜性，還常因任務沖突導致性能下降。VSSFlow 則另辟蹊徑，采用了 10 層架構設計并引入“流匹配”技術，讓模型自主學習如何從隨機噪聲中，重構出目標聲音信號。

研究團隊在訓練過程中發現了一個令人驚喜的現象：聯合訓練不僅沒有導致任務干擾，反而產生了“互助效應”。即語音數據的訓練提升了音效生成的質量，而音效數據的加入也優化了語音的表現。

團隊為了實現這一效果，向模型投喂了混合數據，包括配有環境音的視頻、配有字幕的說話視頻以及純文本轉語音數據，并利用合成樣本微調模型，讓其學會同時輸出背景音與人聲。

在實際運行中，VSSFlow 以每秒 10 幀的頻率從視頻中提取視覺線索來塑造環境音效，同時依據文本腳本精確引導語音生成。

測試數據顯示，該模型在多項關鍵指標上均優于專門針對單一任務設計的競品模型。研究團隊目前已在 GitHub 上開源了 VSSFlow 的代碼，并正在推進模型權重公開及在線推理演示的開發工作。

蘋果在屏幕防護上采用了超薄玻璃結合透明聚酰亞胺薄膜的復合結構，而真正實現行業突破的，是其通過內嵌金屬板分散彎折應力、鉸鏈關鍵部件采用液態金屬材質，從硬件底層解決折痕問題。iPhone Fold的屏幕由三星獨…

02-23

TCL 12月登頂全球電視出貨量榜首，中國品牌崛起改寫行業格局！

但這次是真的，根據調研機構CounterpointResearch最新的市場報告顯示，2025年12月，TCL終于把那個曾經遙不可及的三星拉下了馬，首次登頂全球電視出貨量月度榜首！但現在不同了，通過這次…

02-23

蘋果新機策略大變陣：7月量產折疊屏與18 Pro，標準版延期至明年春季

過去幾年，標準版往往分流了部分Pro的關注度，現在蘋果把資源集中在Fold和Pro上，不僅優化供應鏈，也會進一步強化高端形象。節奏雖然還是和往年一樣，7月量產、9月發售，但登場的卻是iPhone Fold…

02-23

消息人士透露一加重啟15s手機研發，定位調整或基于15T修改

IT之家 2 月 22 日消息，消息人士 Yogesh Brar 今天在 X 平臺透露，一加已經恢復 15s 手機的研發計劃，但定位有所變化。作為參考，一加曾于去年 4 月在中國市場推出 13T 手機，隨后…

02-23

紅米K80：驍龍8Gen3搭配2K屏與大電池，1529元成銷量“黑馬”之選

在如今的千元檔市場，性能往往是最容易被妥協的一環，有很多搭載天璣芯片、驍龍7系列芯片等，但紅米K80作為定位旗艦機型，而并非千元市場，驍龍8 Gen3的加入，讓它在同價位幾乎形成了“降維打擊”。它并不是為了…

02-23

蘋果3月初或迎新品潮：低價MacBook領銜，多款硬件軟件齊更新

而如果發布時間沒有提前，iPhone 17e 也大概率會出現在這一波更新中。 Gurman 指出，目前蘋果門店中 iPhone 16e、M3iPad Air、M4 MacBook Air 以及 M4 Pr…

02-23

華為暢享80X將至：8000mAh大電池+麒麟新U+高刷大屏，千元檔新選擇

小智還記得去年上半年6000毫安電池還算大電池，一轉眼到下半年電池容量就開始飆升，一路從六字頭殺到七字頭，再沖上八字頭，年底和今年初10000和9000毫安都有了據最新爆料消息稱，華為即將發布一款定價"平民檔…

02-23

時隔四年紅色系再登場！iPhone 18 Pro測試深紅配色或將填補Pro系列空白

快科技2月22日消息，據馬克?古爾曼最新爆料，蘋果正為iPhone 18 Pro系列測試全新深紅色配色，這也是紅色系首次有望登陸iPhonePro機型。據悉，此次iPhone 18 Pro嘗試深紅色主要得…

02-23

三星Galaxy S26系列官宣2月26日登場，Ultra版屏幕影像大升級引期待

或許，三星手機的發展方向與國內市場不同，國內新機更傾向于專業影像、高性能、高續航+百瓦快充等，而且新機定位越來越清晰，從而促進各大機型發展。其中的Ultra版本為最高，而且多方面進行大升級，尤其是屏幕、影像等…

02-23

蘋果3月4日推低價MacBook：A18 Pro芯片加持，多彩設計瞄準學生輕辦公

02-23

古爾曼爆料：蘋果3月2日起密集發布新品，全新低配版MacBook或成焦點

02-23

Epic Games收購Meshcapade 拓展數字人建模領域助力多行業實時應用

02-23

iPhone 18 Pro或推深紅色新配色折疊屏iPhone Fold配色回歸經典基礎款

02-23

三星2月26日全球發布會：Galaxy Buds4 Pro攜新設計及功能亮相

02-23

iPhone 18 Pro或推深紅配色時隔四年紅色系重返Pro機型

02-23

點擊查看更多 +

全站最新

沃爾沃ES90申報圖曝光！2026年亮相，800V高壓平臺+700km續航成亮點

2026年MPV市場劇變：賽那崛起GL8式微，混動成營運與家用新寵

特斯拉Grok歐洲上線：技術突圍遇監管風暴，銷量救星還是合規難題？

2026年2月北京旅行社TOP10權威榜單揭曉！深度解析靠譜之選與行業新趨勢

2026北京旅行社好評榜發布！珈程憑零投訴與高滿意度領跑，出游避坑就選它

比亞迪“天神之眼”ABC三檔全解析：一文讀懂幾十款車型的智駕配置

熱門內容

本欄最新

尊界M900諜照引關注：華為攜中國汽車向傳統豪華品牌發起挑戰

尊界M900諜照流出：華為百萬級SUV如何改寫豪華車市場新格局？

春節返程高峰將至，避開這些“雷區”，安全駕駛助你順利歸程

返程路上年味濃，拒絕分心駕駛，握緊方向盤守護平安歸途

北歐純電新標桿！沃爾沃ES90攜800V快充登場，續航穩、安全強，上半年見

穿越十萬公里的考驗：現代Staria舒適與實用并存，優缺點一目了然

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.