在線視頻巨頭YouTube近日宣布,其基于人工智能技術(shù)的自動配音功能已面向全球用戶正式上線。該功能支持包括中文在內(nèi)的27種主流語言互譯,其中英語、法語、德語等8種語言還特別推出"情感化語音"選項(xiàng),通過調(diào)整語調(diào)、語速和重音等參數(shù),使配音更具表現(xiàn)力和感染力。
針對普通觀眾,平臺會根據(jù)用戶觀看歷史自動匹配配音語言,并在播放器界面新增語言選擇按鈕。用戶既可保留視頻原聲,也可通過下拉菜單切換至目標(biāo)語言,系統(tǒng)會實(shí)時生成對應(yīng)配音。測試顯示,中文配音的準(zhǔn)確率達(dá)到92%以上,在新聞、教育等類型內(nèi)容中表現(xiàn)尤為突出。
內(nèi)容創(chuàng)作者方面,系統(tǒng)默認(rèn)開啟自動配音功能,但允許手動關(guān)閉。為提升翻譯質(zhì)量,YouTube開發(fā)了智能內(nèi)容識別系統(tǒng),可自動過濾音樂、純音效等不適合配音的片段。正在測試的唇形同步技術(shù)通過分析視頻人物口型變化,動態(tài)調(diào)整配音時間軸,使翻譯后的語音與原始畫面口型保持同步,有效降低違和感。
目前支持的配音方向涵蓋雙向互譯:從英語可轉(zhuǎn)譯為阿拉伯語、孟加拉語、荷蘭語等20種語言;從中文則可轉(zhuǎn)譯為阿拉伯語、孟加拉語、荷蘭語等24種語言。平臺技術(shù)團(tuán)隊(duì)表示,后續(xù)將持續(xù)優(yōu)化方言識別和俚語翻譯功能,特別針對中文多音字和日語敬語體系進(jìn)行專項(xiàng)訓(xùn)練。
這項(xiàng)功能在測試階段已獲得積極反饋。某教育頻道創(chuàng)作者表示,自動配音使其課程覆蓋范圍從單一語言市場擴(kuò)展至全球150個國家和地區(qū),觀看量增長370%。普通用戶調(diào)研顯示,83%的受訪者認(rèn)為情感化語音提升了跨語言觀看體驗(yàn),尤其在紀(jì)錄片和劇情類內(nèi)容中效果顯著。











