滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

月之暗面發布新論文：AttnRes模塊亮相，深度學習2.0時代或將來臨

時間：2026-03-18 06:55:06 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

在深度學習領域，一場關于模型架構創新的討論正愈演愈烈。近日，月之暗面團隊發布了一項突破性研究，提出了一種名為注意力殘差（Attention Residuals，簡稱AttnRes）的新型模型模塊，為深度學習模型的發展開辟了新路徑。這一成果不僅引發了學界和業界的廣泛關注，更得到了前OpenAI核心成員Jerry Tworek等知名學者的高度評價。

傳統Transformer架構中，殘差連接是確保深層網絡穩定訓練的關鍵設計。每一層的輸出會直接與前一層相加，形成"等權累加"的機制。這種設計雖然解決了梯度消失問題，但隨著模型層數增加，歷史層信息被簡單疊加，導致深層網絡表達能力受限。月之暗面的研究團隊敏銳地捕捉到了這一局限性，提出用動態注意力機制替代固定殘差連接的創新方案。

AttnRes的核心突破在于引入了可學習的權重分配機制。每層網絡不再被動接受前層輸出，而是通過注意力機制主動"檢索"歷史層中最有價值的信息。這種設計使模型能夠根據當前上下文動態調整信息聚合方式，有效緩解了深層網絡中的信息稀釋問題。研究團隊進一步提出的塊級注意力殘差（Block AttnRes）結構，通過將網絡劃分為多個計算塊，在保持靈活性的同時顯著降低了計算復雜度。

實驗數據顯示，將AttnRes集成到480億參數的Kimi Linear架構后，模型在1.4萬億token的預訓練中展現出顯著優勢。在數學推理、科學問答等復雜任務上，新模型性能提升超過20%，特別是在多步推理基準測試GPQA-Diamond中表現尤為突出。更令人矚目的是，Block AttnRes在驗證損失上達到1.692，相比基線模型1.714的成績，相當于提升了約25%的計算效率。

這項創新不僅體現在理論層面，更在工程實現上取得突破。研究團隊針對Block AttnRes帶來的通信開銷問題，開發了跨階段緩存機制，將訓練階段的額外開銷控制在4%以內。在推理階段，通過兩階段計算策略和序列分片技術，使內存延遲增加不超過2%，同時顯著降低了長上下文場景下的顯存需求。這些優化措施確保了新技術在實際應用中的可行性。

據研究團隊介紹，該成果是數十名研究員共同協作的結晶，其中Guangyu Chen、Yu Zhang和Jialin Su三位研究員貢獻最為突出。這項突破不僅展示了中國研究團隊在AI基礎架構領域的創新能力，也為全球深度學習社區提供了值得深入探索的新方向。隨著相關研究的持續推進，注意力機制在深度維度上的應用有望成為下一代模型架構的關鍵特征。

更多>同類資訊

安卓數據備份軟件怎么選？實測十款主流工具，幫你找到最適合的方案

并且它當中最為關鍵的問題在于，是備份文件所具備的封閉性該軟件備份生成的文件，具有其自身獨有的加密格式，這也就表明，你僅僅能夠于備份精靈這款軟件里進行數據恢復操作一旦這款軟件停止運行，…

03-18

小米九號平衡車：輕巧便攜性能強，全家出行智能代步新伙伴

今天，我將分享我對小米九號平衡車的真實使用體驗，并與同類產品進行對比分析，幫助大家更好地了解這款產品的獨特價值。與同類產品相比，小米九號平衡車在耐用性上具有明顯優勢，尤其適合兒童日常使用，能夠承受摔打和碰撞。…

03-18

雷軍力薦！新一代SU7首發小米蛟龍底盤駕控升級打造駕駛者之車

這次迭代改款主要改了內飾，底盤，電子電器架構、輔助駕駛硬件等等其中，底盤的升級就是重點之一。“這是專為駕駛者打造的高性能智能底盤系統，一定能讓大家感受到極為出色的駕駛質感。3月19日19點，新一代小米SU7將…

03-18

2026款小米SU7 3月19日上市！外觀內飾升級，續航最長902Km引期待

2026款小米SU7全面升級，外觀更運動，性能更強，智能安全升級，預售22.99萬元，主打高性價比。

03-18

小米汽車兩周年獻禮老車主：三枚勛章加定制冰箱貼，感恩一路相伴

快科技3月18日消息，初代小米SU7即將在本月底迎來發布兩周年，小米汽車面向老車主推出專屬紀念福利，為符合條件的用戶發放三枚虛擬勛章。夢想同行者勛章：則專屬初代SU7、YU7、SU7Ultra首銷期的首任車主…

03-18

新款小米SU7來襲！配置全面升級，或再掀車圈熱潮，Model 3壓力倍增

根據官方的預售信息，新款小米SU7，真要漲價啊。總的來說，新款雖然說了“肯定會漲價”，但就算真漲1萬左右，那新款的小米SU7配置升級的誠意，也夠夠的了。上一代都如此暢銷、保值率也不低，可見這全新小米SU7有多…

03-18

小米汽車送福利！第一代SU7 YU7 Ultra首任車主可領定制冰箱貼限量15萬份

IT之家3月17日消息，據博主@懶醬的日記本分享，小米向第一代SU7/YU7/Ultra首銷期首任車主贈送定制冰箱貼，限量15萬份。博主分享的截圖顯示，該冰箱貼采用汽車造型設計，選用卡布里藍配色，定價19.9…

03-18

雷軍力薦！新一代SU7首發小米蛟龍底盤駕控升級預售22.99萬元起

這次迭代改款主要改了內飾，底盤，電子電器架構、輔助駕駛硬件等等其中，底盤的升級就是重點之一。“這是專為駕駛者打造的高性能智能底盤系統，一定能讓大家感受到極為出色的駕駛質感。3月19日19點，新一代小米SU7將…

03-18

百度AIDAY龍蝦專場啟幕 “龍蝦”全家桶攜DuMate等多款新品驚艷登場

沈抖表示，今年春節OpenClaw的火爆，讓更多人真正看見了智能體，百度智能云致力于持續推出更多低門檻、低成本體驗OpenClaw的產品方案，同時基于自身產品推出更多優質的Skills，為整個OpenCla…

03-18

小牛電動發布全球首款AI兩輪車系統，攜手頂級供應鏈開啟“AI好車”新十年

03-18

百度搜索Skill下載量全球第一，沈抖：搜索是龍蝦類Agent落地的重要基礎設施

03-18

馬斯克盛贊Kimi“注意力殘差”研究，Kimi幽默回贊馬斯克火箭成就

【CNMO科技消息】近日，在特斯拉CEO埃隆·馬斯克公開點贊中國AI公司Kimi的最新研究成果后，Kimi官方賬號于3月17日以幽默口吻回應：“你的火箭造得也不錯！” 據CNMO了解，事件的起因是3月16日，…

03-18

虎牙2025年財報亮眼：全年營收65億，Q4創新高，《鵝鴨殺》成新增長極

03-18

物理AI浪潮下，百度“小度+OpenClaw”如何開啟家庭智能新想象？

03-18

杰理科技四闖A股迎北交所大考小米2.4億入股能否收獲上市碩果？

03-18

點擊查看更多 +

全站最新

雷軍正式宣布：蘇炳添出任小米汽車品牌代言人，雙方合作再續新篇

小米汽車送福利！第一代SU7 YU7 Ultra首銷首任車主可領定制冰箱貼

蘇炳添成小米汽車代言人引熱議雷軍趣答：跑最快、是車主還姓SU

科大訊飛翻譯機4.0深度評測：無網絡也能譯，出國旅行溝通再無阻！

科大訊飛P30 Turbo學習機體驗：AI賦能個性化學習，護眼設計助力高效成長

蘇炳添成小米汽車代言人引熱議，雷軍幽默回應：跑得快還姓SU很契合

熱門內容

本欄最新

雷軍正式宣布：蘇炳添出任小米汽車品牌代言人，雙方合作再續新篇

小米汽車送福利！第一代SU7 YU7 Ultra首銷首任車主可領定制冰箱貼

蘇炳添成小米汽車代言人引熱議雷軍趣答：跑最快、是車主還姓SU

科大訊飛翻譯機4.0深度評測：無網絡也能譯，出國旅行溝通再無阻！

科大訊飛P30 Turbo學習機體驗：AI賦能個性化學習，護眼設計助力高效成長

蘇炳添成小米汽車代言人引熱議，雷軍幽默回應：跑得快還姓SU很契合

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

月之暗面發布新論文：AttnRes模塊亮相，深度學習2.0時代或將來臨