岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

蘋果公布PCG技術:質量零妥協(xié)、AI語音生成提速40%

   時間:2026-02-03 11:40:42 來源:IT之家編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

2 月 3 日消息,科技媒體 9to5Mac 今天(2 月 3 日)發(fā)布博文,報道稱蘋果公司攜手特拉維夫大學,聯(lián)合發(fā)表論文,提出名為“原則性粗粒度”(PCG)的語音生成新方法,從而解決 AI 文本轉語音(TTS)技術的速度瓶頸。

援引博文介紹,在生成語音方面,目前行業(yè)主流采用“自回歸模型”,采用“逐個預測”的方式,即基于已有的 tokens 來預測下一個。

然而,這種機制要求預測結果必須“精確匹配”預設的 tokens,導致模型經常拒絕實際上聽感差異極小、完全可用的預測結果。這種過于嚴苛的驗證標準,直接拖慢了整體的生成速度。

研究團隊為了解決上述問題,提出了“原則性粗粒度”(Principled Coarse-Graining,簡稱 PCG)技術。該技術的核心邏輯在于“求同存異”:研究人員認為,不同的聲學 token 往往能產生幾乎相同的聽覺效果。

因此,PCG 不再將每個聲音視為完全獨立的個體,而是建立了“聲學相似組”。只要模型生成的預測 token 落在正確的“相似組”范圍內,系統(tǒng)就會予以采納。這種靈活的驗證機制,本質上是將嚴苛的“單點驗證”升級為了容錯率更高的“范圍驗證”。

在具體運行中,PCG 引入了“投機解碼”策略,構建了一套雙模型協(xié)作架構。首先,由一個輕量級的小模型快速“猜測”并提出候選語音 token;隨后,由一個參數更大的“裁判模型”進行審核。

只要候選 token 屬于正確的聲學組,大模型便會“放行”。這種分工不僅保留了小模型的高速度,也利用大模型保障了輸出質量,有效平衡了效率與準確性。

試驗數據顯示,應用 PCG 技術后,語音生成速度提升了約 40%,且并未犧牲音頻質量。在自然度評分(滿分 5 分)中,該模型取得了 4.09 的高分。

在一項極限壓力測試中,研究人員將 91.4% 的語音 token 替換為同組的其他 token,結果顯示詞錯率僅增加了 0.007,說話人相似度僅下降 0.027,人耳幾乎無法察覺差異。

PCG 屬于“推理階段”的優(yōu)化方案,意味著無需對現(xiàn)有模型進行耗時耗力的重新訓練即可直接應用。存儲聲學相似組僅需約 37MB 的額外內存。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 91视频综合 | 日本五十路女优 | 韩国精品久久久 | 亚洲最大福利网 | 黄色成人影视 | 久草手机在线视频 | 一区二区三区免费在线视频 | 放几个免费的毛片出来看 | 不卡中文字幕 | 日韩免费在线观看视频 | 能看毛片的网站 | 在线观看小视频 | 成人在线小视频 | 欧美三级视频网站 | 国产精品日韩av | 国产激情视频在线播放 | 久久久精品久久久久 | 免费观看黄色大片 | 国产麻豆精品一区二区 | 亚洲成人福利视频 | 成人午夜久久 | 99精品欧美一区二区蜜桃免费 | 97色在线| 一级特黄aaaaaa大片 | 欧美日韩一二三 | 亚洲视频一区二区 | 国产精品婷婷午夜在线观看 | 欧美一级免费看 | 国产一区二区播放 | 日韩av在线一区 | 亚洲精品久久久久久久久久久久久 | 免费一级片在线观看 | 久久99深爱久久99精品 | 国产精品美女久久久久久久久 | 亚洲成人看片 | 日韩精品一区二区在线观看 | 在线视频中文字幕 | 久久久www成人免费毛片 | 蜜臀久久99精品久久一区二区 | 国产专区精品 | 成人在线激情视频 |