字節(jié)跳動(dòng)旗下豆包App迎來重大升級(jí),其語音通話功能正式接入全新原生全雙工語音大模型Seeduplex。該模型通過突破性技術(shù)架構(gòu),實(shí)現(xiàn)了對(duì)話流暢度與交互自然度的質(zhì)的飛躍,標(biāo)志著語音交互領(lǐng)域進(jìn)入"邊聽邊說"的新紀(jì)元。

相較于傳統(tǒng)半雙工模型需要等待用戶說完才能響應(yīng)的局限,Seeduplex采用創(chuàng)新的全雙工框架設(shè)計(jì),使系統(tǒng)能夠同時(shí)處理語音輸入與輸出。這種技術(shù)突破讓機(jī)器具備類似人類的"邊聽邊思考"能力,在用戶停頓、思考或表達(dá)過程中即可生成自然回應(yīng),徹底改變了以往語音交互的機(jī)械感。測(cè)試數(shù)據(jù)顯示,新模型在復(fù)雜聲學(xué)環(huán)境下的誤回復(fù)率降低50%,對(duì)話節(jié)奏控制能力提升40%,真正實(shí)現(xiàn)了"有來有往"的擬人化交流。
該模型的核心技術(shù)突破體現(xiàn)在兩大維度:在抗干擾能力方面,通過持續(xù)聲學(xué)環(huán)境感知技術(shù),可精準(zhǔn)區(qū)分目標(biāo)語音與背景噪音,即便在地鐵、商場(chǎng)等嘈雜場(chǎng)景中,依然能保持95%以上的識(shí)別準(zhǔn)確率;在對(duì)話節(jié)奏控制上,獨(dú)創(chuàng)的動(dòng)態(tài)判停機(jī)制結(jié)合語音特征與語義理解,既能耐心等待用戶組織語言,又能在表達(dá)結(jié)束瞬間快速響應(yīng),搶話現(xiàn)象減少40%,對(duì)話流暢度提升35%。
多維度評(píng)測(cè)顯示,Seeduplex在對(duì)話自然度、響應(yīng)及時(shí)性等關(guān)鍵指標(biāo)上全面超越行業(yè)主流方案。特別是在判停準(zhǔn)確率方面,較傳統(tǒng)半雙工模型提升8個(gè)百分點(diǎn),達(dá)到92%的行業(yè)領(lǐng)先水平。大規(guī)模用戶測(cè)試證實(shí),升級(jí)后的語音通話功能使用時(shí)長增加22%,用戶留存率提升15%,通話滿意度絕對(duì)值提高8.34%,"搶話""延遲響應(yīng)"等負(fù)面反饋顯著減少。
目前,用戶只需將豆包App更新至最新版本,在對(duì)話框選擇"打電話"功能即可體驗(yàn)。為提升沉浸感,系統(tǒng)特別優(yōu)化了"桃子音色"的語音表現(xiàn),使交互更具情感溫度。此次升級(jí)不僅標(biāo)志著語音交互技術(shù)的重要突破,更為智能助手、在線客服等場(chǎng)景提供了新的技術(shù)范式,推動(dòng)人機(jī)對(duì)話向更自然、更高效的方向發(fā)展。
















