滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

DeepSeek聯(lián)合北大清華發(fā)布DualPath框架：解鎖智能體推理新速度

時間：2026-02-27 15:24:29 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在智能體應(yīng)用場景中，對話輪次增加與上下文長度擴(kuò)展已成為常態(tài)，但傳統(tǒng)推理架構(gòu)卻因此面臨嚴(yán)峻挑戰(zhàn)。研究團(tuán)隊(duì)發(fā)現(xiàn)，當(dāng)KV-Cache命中率超過95%時，系統(tǒng)性能的瓶頸已從計(jì)算能力轉(zhuǎn)向數(shù)據(jù)搬運(yùn)效率。實(shí)驗(yàn)數(shù)據(jù)顯示，在現(xiàn)有預(yù)填充-解碼分離架構(gòu)中，預(yù)填充引擎的存儲網(wǎng)卡帶寬常因過度使用而飽和，而解碼引擎的同類資源卻處于閑置狀態(tài)，這種資源錯配直接導(dǎo)致推理效率受限。

技術(shù)實(shí)現(xiàn)層面，該框架采用三組件協(xié)同架構(gòu)。推理引擎模塊嚴(yán)格區(qū)分預(yù)填充與解碼功能，每塊GPU對應(yīng)專屬引擎；流量管理器負(fù)責(zé)跨設(shè)備數(shù)據(jù)傳輸與存儲讀寫；中央調(diào)度器則扮演決策中樞角色，根據(jù)實(shí)時網(wǎng)絡(luò)狀態(tài)與計(jì)算負(fù)載，為每個請求智能選擇最優(yōu)傳輸路徑。這種分層設(shè)計(jì)既保證了專業(yè)功能的高效執(zhí)行，又通過全局調(diào)度實(shí)現(xiàn)了資源利用最大化。

針對雙路徑可能引發(fā)的流量沖突問題，研究團(tuán)隊(duì)提出雙重優(yōu)化機(jī)制。在硬件層面，通過計(jì)算網(wǎng)卡（CNIC）強(qiáng)制所有流量經(jīng)GPUDirect RDMA路徑傳輸，并利用虛擬層技術(shù)為推理通信分配99%的帶寬優(yōu)先級。在軟件層面，自適應(yīng)調(diào)度器持續(xù)監(jiān)測各節(jié)點(diǎn)磁盤隊(duì)列長度與Token處理量，優(yōu)先將任務(wù)分配給I/O壓力小且計(jì)算負(fù)載輕的節(jié)點(diǎn)，從根源上避免資源擁塞。

該研究的第一作者為北京大學(xué)博士生吳永彤，其研究方向聚焦于大模型基礎(chǔ)設(shè)施的工程優(yōu)化。目前他在DeepSeek系統(tǒng)組參與下一代推理框架開發(fā)，負(fù)責(zé)多硬件平臺的性能調(diào)優(yōu)工作。這段學(xué)術(shù)與產(chǎn)業(yè)結(jié)合的經(jīng)歷，使其能夠精準(zhǔn)把握系統(tǒng)軟件優(yōu)化與規(guī)模化部署的關(guān)鍵痛點(diǎn)。

02-27

魅族宣布戰(zhàn)略調(diào)整：暫停手機(jī)自研硬件，轉(zhuǎn)向AI驅(qū)動軟件生態(tài)，CEO表信心

02-27

春節(jié)期間三大AI應(yīng)用DAU表現(xiàn)亮眼千問增幅顯著且縮小與豆包日活差距

02-27

春節(jié)AI應(yīng)用大戰(zhàn)：豆包千問元寶DAU創(chuàng)新高，千問暴增940%領(lǐng)跑增長

02-27

李想談AI時代：普通人與專家差距拉大頂級專家優(yōu)勢將更凸顯

02-27

成都經(jīng)開區(qū)捷達(dá)科技加速轉(zhuǎn)型 70%本地配套純電新車9月將下線

02-27

?從“助手”進(jìn)化為“代工”！蘋果發(fā)布 Xcode 26.3：原生集成 Claude 與 ChatGPT

02-27

給Claude裝上“眼睛”！Anthropic斥資收購Vercept：高精度 UI 識別碾壓 OpenAI，智能體進(jìn)入“視覺時代”

02-27

英偉達(dá)年收入增至2160億美元，黃仁勛稱智能體AI已達(dá)轉(zhuǎn)折點(diǎn)

02-27

廣汽集團(tuán)成立具身智能機(jī)器人公司慧侖科技

02-27

漢堡王推出AI監(jiān)工：在員工耳機(jī)中部署

02-27

阿斯麥新一代EUV光刻機(jī)已具備量產(chǎn)條件，造價(jià)約4億美元

02-27

前魅族Flyme負(fù)責(zé)人楊顏預(yù)熱將推出AI電子寵物產(chǎn)品Aimo

02-27

三大AI應(yīng)用春節(jié)DAU創(chuàng)新高千問縮小與豆包差距

02-27

三大AI應(yīng)用春節(jié)激戰(zhàn)DAU均創(chuàng)新高，豆包峰值1.45億

02-27

點(diǎn)擊查看更多 +

全站最新

問界M6七色車身官宣亮相增程純電雙版本3月4日全球首發(fā)在即

領(lǐng)克03大尾翼版官圖亮相 2026年上市動力強(qiáng)勁內(nèi)飾熾熱

第三代領(lǐng)克03大尾翼版3月5日登場，運(yùn)動內(nèi)飾+強(qiáng)勁動力，個性之選來襲

2026款日產(chǎn)Versa下月墨西哥首發(fā) 配置升級 1.6L動力延續(xù)老款規(guī)格

廣汽豐田鉑智7三月登場！集鴻蒙Momenta小米華為之力，能否成爆款？

HALO交易爆火！有色金屬“殺”回來了

熱門內(nèi)容

本欄最新

成都經(jīng)開區(qū)捷達(dá)科技加速轉(zhuǎn)型 70%本地配套純電新車9月將下線

湖南碼界領(lǐng)航教育：Python開發(fā)多元路徑，開啟技術(shù)時代高薪職業(yè)新篇

從CES舞臺看未來：激光雷達(dá)如何“滲透”生活與工業(yè)場景？——對話圖達(dá)通CEO鮑君威

英偉達(dá)2025年財(cái)報(bào)揭曉：汽車業(yè)務(wù)成新增長極兩年收入翻倍引關(guān)注

智電時代馬力易得操控難求，蓮花1億剎車投入詮釋超豪華新內(nèi)核

廣汽集團(tuán)孵化慧侖科技，具身智能機(jī)器人邁向產(chǎn)業(yè)化落地新征程

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek聯(lián)合北大清華發(fā)布DualPath框架：解鎖智能體推理新速度