滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

DeepSeek開源新架構(gòu)Engram：梁文鋒領(lǐng)銜，實習生參與，或推動AGI發(fā)展

時間：2026-01-14 19:35:41 來源：快訊編輯：快訊 IP：北京 發(fā)表評論無障礙通道

近日，人工智能領(lǐng)域迎來一項重要突破——DeepSeek團隊提出了一種名為Engram的新型“條件記憶”機制，為混合專家模型（MoE）的發(fā)展開辟了新路徑。該機制旨在讓MoE模型在保持海量參數(shù)的同時，更高效地處理語言信息，實現(xiàn)性能與成本的雙重優(yōu)化。

傳統(tǒng)MoE模型通過稀疏激活機制擴展模型容量，但存在路由成本高、訓練不穩(wěn)定等問題。DeepSeek團隊觀察到，現(xiàn)有Transformer架構(gòu)缺乏真正的知識檢索機制，導致模型不得不重復計算常見的事實性內(nèi)容，如固定表達、歷史名詞等，造成計算資源的浪費。為此，他們提出將靜態(tài)知識存儲與動態(tài)計算解耦，通過外接記憶庫提升模型效率。

Engram架構(gòu)的核心創(chuàng)新在于引入條件記憶模塊，該模塊通過分詞器壓縮、多頭哈希、上下文感知門控等技術(shù)，構(gòu)建了可擴展的靜態(tài)知識庫。實驗表明，在相同算力條件下，Engram-27B模型在32768個token的長上下文任務(wù)中，RULER基準測試性能超越同參數(shù)量MoE模型，且訓練計算量減少18%。更引人注目的是，其1000億參數(shù)記憶表卸載后，H800硬件推理吞吐量降幅不足3%，展現(xiàn)了極高的系統(tǒng)效率。

研究團隊通過大量實驗驗證了Engram與MoE的互補性。當資源分配比例為75%-80%給MoE、20%-25%給Engram時，模型性能達到最優(yōu)。進一步擴展記憶容量發(fā)現(xiàn)，驗證損失持續(xù)穩(wěn)定下降，且性能提升嚴格遵循冪律分布，這為模型的可預測擴展提供了新思路。相比傳統(tǒng)記憶方法，Engram在知識密集型任務(wù)和通用推理任務(wù)中均表現(xiàn)出更顯著的優(yōu)勢。

機制分析顯示，Engram模塊在模型淺層效果最佳，能夠盡早卸載局部模式重建任務(wù)，使深層網(wǎng)絡(luò)專注于復雜推理。功能敏感性測試表明，關(guān)閉Engram會導致事實性知識任務(wù)性能災(zāi)難性下降，而閱讀理解任務(wù)幾乎不受影響，這驗證了其作為知識存儲主要倉庫的角色。門控機制激活分析進一步揭示，Engram在處理多詞實體、固定短語等靜態(tài)模式時自動啟用，與注意力機制形成有機互補。

與外部記憶檢索增強（RAG）相比，Engram將知識內(nèi)化于參數(shù)化記憶表中，實現(xiàn)了更低的延遲和更強的知識一致性。該架構(gòu)還支持高效的硬件優(yōu)化，通過預取和層次化存儲策略，能夠擴展至超大規(guī)模記憶而保持系統(tǒng)穩(wěn)定性。研究團隊認為，這種解耦設(shè)計為知識蒸餾提供了新范式，未來可通過單獨更新記憶表來修正模型知識，無需昂貴的微調(diào)過程。

【CNMO科技消息】1月14日，國內(nèi)人工智能企業(yè)智譜與華為聯(lián)合宣布，開源新一代圖像生成模型GLM-Image。API調(diào)用模式下，生成一張圖片的成本僅為0.1元，極大降低了企業(yè)和開發(fā)者使用先進圖像生成技術(shù)的門檻…

01-14

物理AI時代來臨：從智能眼鏡到機器人，正悄然改變生活圖景

"想想這些傳感器、眼鏡等等，如果我戴著眼鏡，并基于'哦，我在這里看到了什么'而采取行動，立即就會產(chǎn)生大量信息，這也可以幫助機器人，創(chuàng)造出今天新的信息集合，"Saxena說。這些設(shè)備可以感知環(huán)境并與用戶的真實…

01-14

板狀天線：技術(shù)革新賦能通信網(wǎng)絡(luò)，多元場景驅(qū)動未來智能新發(fā)展

在無線通信技術(shù)飛速發(fā)展的今天，從城市高樓頂部的5G基站到偏遠山區(qū)的衛(wèi)星地面站，從智能工廠的自動化產(chǎn)線到車載通信系統(tǒng)，板狀天線以其獨特的定向輻射特性，成為構(gòu)建高效、穩(wěn)定通信網(wǎng)絡(luò)的核心組件。（1）遠距離通信：在…

01-14

潮州靈活用工賽道崛起黑馬，廣東微靈工以技術(shù)+服務(wù)+合規(guī)領(lǐng)跑市場

公司核心業(yè)務(wù)聚焦數(shù)字技術(shù)服務(wù)與靈活用工解決方案的深度融合。面對靈活用工市場年復合增長率超20%的發(fā)展機遇，廣東微靈工科技有限公司計劃未來三年投入1000萬元用于技術(shù)研發(fā)，重點布局區(qū)塊鏈在用工結(jié)算中的應(yīng)用、…

01-14

華為馬悅：以數(shù)智融合為翼，攜手伙伴共繪物流產(chǎn)業(yè)智慧供應(yīng)鏈新藍圖

雙方團隊緊密協(xié)作，圍繞云南建投物流“成為世界一流供應(yīng)鏈生態(tài)運營商”的愿景，聯(lián)合廣大生態(tài)伙伴，對跨境物流、園區(qū)運營、冷鏈服務(wù)等關(guān)鍵場景開展了系統(tǒng)性調(diào)研與聯(lián)合診斷；結(jié)合“云上營家”的品牌藍圖，雙方共同推進方案設(shè)計…

01-14

蘋果加速AI布局：2026年量產(chǎn)自研芯片 2027年新數(shù)據(jù)中心投入使用

01-14

Anthropic推AI編程助手Cowork：依賴Claude快速開發(fā)，降低編程門檻引關(guān)注

01-14

中車唐山公司：以質(zhì)量筑基，憑先進體系與技術(shù)在國內(nèi)外市場“馳騁”

01-14

斯菱智驅(qū)更名：從軸承制造到智能驅(qū)動，機器人賽道開啟新征程

01-14

優(yōu)必選攜手國評廣州：共建平臺與實驗室共促人形機器人質(zhì)量提升

01-14

京基智農(nóng)主業(yè)承壓，跨界收購江蘇匯博，能否借機器人業(yè)務(wù)破局？

01-14

48小時雙鐘齊鳴中國AI大模型資本競速商業(yè)新局徐徐展開

01-14

上線倆月月活破億！千問在學生白領(lǐng)群體中迅猛增長，周四還將迭代升級

01-14

王小川談螞蟻“阿福”：已看膩，還遭其瘋狂挖角百川醫(yī)療團隊

01-14

AI辦公新紀元：Claude Cowork橫空出世，人類工作模式迎來顛覆性變革

01-14

點擊查看更多 +

全站最新

雷軍轉(zhuǎn)發(fā)報道證實：小米SU7二手車保值率達80.1% 躋身行業(yè)前列

潘九堂談車企發(fā)展：小米或借鑒理想增程經(jīng)驗，呼吁理性看待模仿創(chuàng)新

小米9月闊折疊新機來襲：自研芯片+折疊OS，與蘋果Q3正面交鋒引期待

潘九堂談新能源汽車：模仿為創(chuàng)新奠基，小米若涉增程或向理想取經(jīng)

小米汽車科技再發(fā)力獲批登記“AI小蘇-智能診斷專家系統(tǒng)”軟著權(quán)

雷軍宣布小米汽車車主課堂報名啟動！全年600余場免費活動覆蓋50城助車主安全駕駛

熱門內(nèi)容

本欄最新

華為馬悅：以數(shù)智融合為翼，攜手伙伴共繪物流產(chǎn)業(yè)智慧供應(yīng)鏈新藍圖

問界5年達成百萬輛里程碑！賽力斯張興海立下軍令狀：兩年再破百萬新關(guān)

保值率持續(xù)領(lǐng)跑！問界M9憑硬核實力重塑豪華SUV市場價值標桿

問界M7長續(xù)航版來襲：327公里純電續(xù)航+旗艦底盤，能否卷動30萬級市場？

10萬級純電SUV新選擇！2026款考拉S攜寧德時代長續(xù)航與智能配置登場

10萬級純電新選擇！2026款考拉S續(xù)航智能雙在線，家庭出行更從容

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek開源新架構(gòu)Engram：梁文鋒領(lǐng)銜，實習生參與，或推動AGI發(fā)展