近日,人工智能公司 Inworld 正式發(fā)布了其最新的文本轉(zhuǎn)語音模型 TTS-1.5。該模型以其自然、富有表現(xiàn)力的實(shí)時語音而備受關(guān)注,能夠在低延遲的情況下提供多語言支持。
根據(jù)官方介紹,TTS-1.5的使用成本約為每分鐘0.005美元,聲稱比市場上的同類產(chǎn)品便宜25倍,這一價格無疑將吸引大量用戶的關(guān)注。
TTS-1.5在技術(shù)上實(shí)現(xiàn)了低于250毫秒的實(shí)時延遲,這意味著用戶可以在對話中幾乎感覺不到任何延遲。語音合成技術(shù)的提升,不僅在速度上有了顯著改善,模型在表達(dá)力和穩(wěn)定性方面也進(jìn)行了優(yōu)化。這為各種應(yīng)用場景,尤其是游戲和虛擬現(xiàn)實(shí)領(lǐng)域的對話系統(tǒng)提供了新的可能性。
除了極具競爭力的價格,用戶對低延遲的需求也在不斷上升。許多用戶認(rèn)為,延遲是文本轉(zhuǎn)語音技術(shù)面臨的一大挑戰(zhàn)。如今,Inworld 的這一創(chuàng)新成果為實(shí)現(xiàn)更真實(shí)的對話體驗鋪平了道路。用戶在社交平臺上對這一技術(shù)表現(xiàn)出了濃厚的興趣,并期待能在自己的項目中應(yīng)用這一新模型。
劃重點(diǎn):











