AIPress.com.cn報(bào)道
2月6日消息,YouTube 近日宣布,已對(duì)其自動(dòng)化 AI 配音功能進(jìn)行升級(jí),新增名為“Expressive Speech(情緒化語(yǔ)音)”的表達(dá)能力,支持英語(yǔ)、法語(yǔ)、德語(yǔ)、印地語(yǔ)、印尼語(yǔ)、意大利語(yǔ)、葡萄牙語(yǔ)和西班牙語(yǔ)八種語(yǔ)言。
該功能旨在改善此前 AI 配音“語(yǔ)調(diào)生硬、缺乏情緒”的問題。YouTube 的自動(dòng) AI 配音功能自 2025 年 6 月起向數(shù)百萬(wàn)創(chuàng)作者自動(dòng)開放,但上線初期因配音聽感偏“機(jī)器人化”,曾引發(fā)創(chuàng)作者和用戶的廣泛爭(zhēng)議。
YouTube 配音產(chǎn)品負(fù)責(zé)人Buddhika Kottahachchi表示,Expressive Speech 功能由 YouTube 與Google DeepMind聯(lián)合研發(fā),通過分析原始視頻中的音高、語(yǔ)調(diào)、節(jié)奏和能量等特征,并將這些元素映射到自動(dòng)配音中,使配音效果更加自然、真實(shí),更接近人類表達(dá)方式。
除語(yǔ)音表現(xiàn)升級(jí)外,YouTube 還同步推出了Automatic Smart Filtering(自動(dòng)智能過濾)功能,用于識(shí)別不適合進(jìn)行 AI 配音的視頻內(nèi)容,例如純音樂視頻或無(wú)對(duì)白的 Vlog,從而避免不必要的自動(dòng)配音,提升整體體驗(yàn)。
在可發(fā)現(xiàn)性方面,YouTube 表示,AI 配音不會(huì)影響原始視頻在平臺(tái)內(nèi)的推薦與搜索表現(xiàn),同時(shí)有助于視頻在其他語(yǔ)言用戶中的曝光和發(fā)現(xiàn)。
考慮到部分用戶對(duì)自動(dòng)配音的偏好差異,YouTube 也引入了Preferred Language(偏好語(yǔ)言)設(shè)置,允許觀眾選擇始終以原始語(yǔ)言觀看視頻,而不默認(rèn)切換至 AI 配音版本。平臺(tái)也進(jìn)一步強(qiáng)化創(chuàng)作者控制權(quán),支持創(chuàng)作者自行上傳多語(yǔ)言音軌,替代或補(bǔ)充 AI 配音。
YouTube 表示,此次更新是其“賦予創(chuàng)作者充分自主權(quán)”承諾的一部分,在擴(kuò)展 AI 能力的同時(shí),保留人工干預(yù)和選擇空間。
數(shù)據(jù)顯示,當(dāng)前自動(dòng)配音視頻的平均觀看時(shí)長(zhǎng)約為原語(yǔ)言視頻的75%,表明非母語(yǔ)觀眾對(duì)自動(dòng)配音內(nèi)容具有較高的參與度。
Kottahachchi 還透露,YouTube 計(jì)劃在未來(lái)將 Expressive Speech 功能擴(kuò)展至更多語(yǔ)言,并推進(jìn)自動(dòng)口型同步(lip sync)技術(shù),該功能目前已進(jìn)入小范圍創(chuàng)作者測(cè)試階段。(AI普瑞斯編譯)











