滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

豆包Seeduplex上線：告別機械對話，開啟AI語音交互自然流暢新時代

時間：2026-04-09 16:07:15 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

字節跳動旗下Seed團隊近日推出原生全雙工語音大模型Seeduplex，并已在豆包App實現全量上線。這項突破性技術標志著語音交互從“回合制問答”向“實時自然對話”的跨越，用戶無需等待AI逐句響應，即可體驗邊聽邊說、動態交互的流暢對話模式。

在咖啡廳嘈雜環境中測試時，Seeduplex展現出精準抗干擾能力。當用戶突然轉向服務員點單時，模型不僅未將無關對話誤認為指令，還能在環境噪音中保持靜默等待，待用戶結束點單后無縫銜接原有話題。這種能力源于模型對原始音頻信號的直接解析，通過聲學特征提取區分目標語音與環境聲，而非傳統語音助手依賴的“降噪-轉寫-理解”流水線模式。

面對用戶故意卡殼的英文面試場景，模型通過動態判停技術展現出人性化交互。當測試者連續使用“um”“uh”等填充詞時，Seeduplex未像傳統系統那樣急于搶答，而是結合語義停頓與聲學特征，準確判斷用戶處于思考狀態。這種基于語音節奏、呼吸模式與語義完整性的綜合判斷機制，使模型搶話比例較前代系統降低40%，對話流暢度評分提升12%。

在飛花令極限測試中，模型展現出驚人的響應速度與上下文記憶能力。當用戶連續說出多句帶“月”詩句后，Seeduplex幾乎同步給出應答，且能識別用戶試圖重復已用詩句的“套娃”行為并即時提醒。官方數據顯示，全雙工模式較半雙工時延縮短250毫秒，打斷響應延遲減少300毫秒，復雜場景下誤回復率降低50%。

技術實現層面，Seed團隊重構了傳統語音交互架構。新系統摒棄ASR（語音識別）、LLM（大語言模型）、TTS（語音合成）的串聯模式，構建端到端原生架構，使模型直接學習語音與語義的一體化表達。通過海量語音數據預訓練與多任務后訓練，系統同步優化對話智能、超低延遲、節奏控制等五項核心能力，并采用投機采樣、量化等技術平衡推理性能與成本。

產業觀察人士指出，這項技術突破將重塑多個應用場景。在車載領域，系統能在復雜路況與多人對話中穩定識別駕駛員指令；教育場景中，口語陪練可感知學生猶豫狀態并調整教學節奏；客服系統則能在多人插話、情緒波動中維持對話連貫性。相較于行業主流語音通話功能，Seeduplex在判停準確率、打斷響應穩定性等核心指標上已形成代際優勢。

測試數據顯示，在模擬真人對話的基準測試中，Seeduplex的響應穩定性甚至超越部分人類對話者。當用戶突然打斷對話要求記錄信息時，模型能立即停止播報并主動詢問是否需要重復要點，這種“被打斷-收聲-等待-繼續”的完整閉環，此前僅在真人通話中可見。技術團隊透露，未來將持續優化模型對情感語調、微表情等非語言信號的感知能力，推動語音交互向多模態自然交流演進。

更多>同類資訊

解鎖Claude Cowork高效潛能：17個步驟助你輕松玩轉智能協作

會用Cowork的人花一個下午建立上下文架構文件、配置全局命令、自定義skill等，然后只需要簡短的提示詞就能實現高質量的自動化。用戶可以定義自己的職業身份、默認輸出格式（如.docx）以及項目交付的底線要求…

04-09

戴森HushJet Mini Cool無葉風扇來襲，無葉安全設計，首發價99美元

所有活動部件都被安全地隱藏在內，這一點至關重要，因為和戴森吹風機一樣，這款產品是為手持使用而設計的。 HushJet Mini Cool搭載一顆 65000 轉 / 分鐘的無刷直流電機，可產生最高 55 英…

04-09

推理經濟崛起：國產芯片迎新機遇，AI產業利潤分配格局重塑

AWS 推 Inferentia 和 Trainium，Google 把 TPU v6e 做到讓 Midjourney 的月支出從 210萬美元降到 70 萬美元，所有云廠商都在自研推理芯片——因為推理是持…

04-09

SCRM深度賦能：解鎖電商私域流量高效管理新路徑與增長策略

尤其是在與企業微信和公眾號等平臺的結合使用上，SCRM能夠實現快速反應，讓客戶的每一個需求都能得到及時處理。在這個過程中，通過有效的管理工具與策略結合，企業不僅能夠維護現有客戶，還能吸引更多潛在客戶，實現更廣…

04-09

京東開源JoyAI-Image-Edit圖像模型：攻克空間難題，賦能多元領域應用

JoyAI-Image-Edit 深度貼合真實世界空間規律，從空間位置關系、多視角一致性、相機感知到場景推理等維度全面建模，實現了相機坐標視角變換、物體空間位移旋轉、幾何結構精準控制等多項空間編輯技術突破。…

04-09

京東JoyAI-Image-Edit開源：破解空間難題，賦能多元領域AI圖像應用升級

JoyAI-Image-Edit 深度貼合真實世界空間規律，從空間位置關系、多視角一致性、相機感知到場景推理等維度全面建模，實現了相機坐標視角變換、物體空間位移旋轉、幾何結構精準控制等多項空間編輯技術突破。…

04-09

谷歌AlphaEvolve助力Substrate：X射線光刻計算提速降本，12nm技術達新高度

IT之家 4 月 9 日消息，Substrate 是一家以 X 射線為光源的光刻技術初創企業，在當地時間本月 7 日的博客中，這家公司表示谷歌DeepMind 的 AlphaEvolve 編程智能體極大程度…

04-09

京東開源JoyAI-Image-Edit圖像模型：開啟AI三維空間編輯新紀元

04-09

貝索斯“普羅米修斯計劃”發力工業AI，欲以技術資本重塑產業新格局

04-09

Google力保隱私：Gmail集成Gemini，構建安全“私人房間”護用戶數據

04-09

小米開源OmniVoice多語言TTS模型：超600種語言支持，語音克隆高效且自然

04-09

AI聊天機器人“知識食糧”從哪來？研究發現近四分之一引言源自新聞報道

04-09

宇樹科技R1機器人亮相阿里園區攜手阿里跨境電商開啟出海新篇章

04-09

谷歌Gemini「notebooks」上線：讓AI擁有長效記憶，打造專屬知識工作空間

04-09

全球銷量前十智能手機iPhone占一半

04-09

點擊查看更多 +

全站最新

CPO概念股走強，通信ETF上漲

B站上線播放頁暫停廣告：商業化嘗試再引熱議，理想現實如何平衡？

字節跳動Seeduplex全雙工語音模型上線，豆包通話實現邊聽邊講更自然

A股鋁業股集體上漲，和勝股份漲停，明泰鋁業逼近漲停

A股異動丨中潤光學一度跌近8% 昨日盤中創歷史新高股東擬減持

巴基斯坦總理證實：美伊已同意在黎巴嫩及所有地區實施即刻停火

熱門內容

本欄最新

B站上線播放頁暫停廣告：商業化嘗試再引熱議，理想現實如何平衡？

字節跳動Seeduplex全雙工語音模型上線，豆包通話實現邊聽邊講更自然

微億智造沖刺IPO：大廠撤離高管涉訴，光環背后隱憂待解

小紅書深耕“好貨”生態：長效經營與線下聯動，激活消費新動能

2026年社交電商用戶達8.3億，Z世代成主力，內容驅動模式引領新消費趨勢

折扣市場成零售新寵：巨頭紛紛入局，消費趨勢轉變催生新機遇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

豆包Seeduplex上線：告別機械對話，開啟AI語音交互自然流暢新時代