字節跳動旗下Seed團隊近日宣布,正式推出新一代原生全雙工語音大模型Seeduplex,該模型已在豆包App完成全量部署。這一技術突破標志著語音交互領域向"邊聽邊說"的自然對話模式邁出關鍵一步。
區別于傳統半雙工模型"先聽后說"的交互邏輯,Seeduplex采用全雙工架構實現"聽""說"同步進行。這種設計使系統能夠實時解析用戶語音輸入,同時生成自然流暢的語音回應,有效消除傳統對話中的延遲感。測試數據顯示,新模型在對話節奏把控和抗干擾能力方面表現突出,即使在背景噪音或多人對話場景下,仍能保持精準的語義理解和連貫的語音輸出。
技術團隊透露,Seeduplex的研發重點在于突破傳統語音模型的時序處理瓶頸。通過構建動態注意力機制和上下文感知模塊,模型能夠根據對話內容實時調整響應速度,在快速應答與深度思考之間取得平衡。這種特性使系統既能處理日常閑聊,也能應對需要邏輯推理的復雜對話場景。
目前用戶已可在豆包App體驗完整功能。實際測試表明,在交通噪聲、背景音樂等干擾環境下,Seeduplex的語音識別準確率較前代提升37%,對話中斷后恢復的流暢度提高42%。這些改進顯著增強了移動場景下的語音交互實用性,為智能助手、在線教育等領域的應用開辟了新可能。








