滾動資訊

Claude Sonnet 4.6空降！Office性能干翻旗艦?zāi)Ｐ?/a>02-18

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

小米MiMo發(fā)布HySparse架構(gòu)：為Agent時代超長文本處理帶來高效新方案

時間：2026-02-08 08:19:08 來源：快訊編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在Agent模型與應(yīng)用迅猛發(fā)展的當(dāng)下，如何精準(zhǔn)且高效地處理超長文本，已成為大模型領(lǐng)域亟待攻克的關(guān)鍵難題。Agent不僅要能在超長上下文中完成穩(wěn)定的檢索、推理以及多輪規(guī)劃任務(wù)，還需在推理階段保持足夠快的響應(yīng)速度。此時，最大的挑戰(zhàn)已從“能否計算”轉(zhuǎn)變?yōu)椤澳芊袼愕闷稹薄?/p>

面對這一挑戰(zhàn)，小米MiMo大模型團(tuán)隊推出了HySparse架構(gòu)，這是一種專為Agent時代打造的混合稀疏注意力架構(gòu)。該架構(gòu)采用“極少的全注意力（Full Attention）+ 稀疏注意力（Sparse Attention）”的核心設(shè)計理念，旨在實現(xiàn)效果與效率的完美平衡。

在多項通用、數(shù)學(xué)、代碼以及中文評測中，HySparse架構(gòu)展現(xiàn)出了卓越的性能。無論是7B Dense規(guī)模還是80B MoE規(guī)模，HySparse均能為模型帶來顯著提升。以80B - A3B MoE模型實驗為例，在總共49層的模型中，HySparse僅保留5層Full Attention，卻依然能夠保持甚至提升模型的整體能力。同時，KV Cache存儲降低至原來的1/11，真正做到了在保證效果的同時大幅提升效率。

RULER長文測試的結(jié)果進(jìn)一步證明了HySparse架構(gòu)的優(yōu)勢。即便將Full Attention層壓縮到極少數(shù)，該架構(gòu)也能穩(wěn)定地保持對長距離關(guān)鍵信息的訪問能力，充分彰顯了其混合稀疏結(jié)構(gòu)的獨特魅力。

HySparse架構(gòu)的創(chuàng)新之處在于其采用了hybrid block結(jié)構(gòu)。每個hybrid block由1層Full Attention和N層Sparse Attention組成。在hybrid block內(nèi)部，Sparse Attention層不再獨立進(jìn)行token選擇和維護(hù)全量KV，而是直接復(fù)用前置Full Attention層生成的重要token索引和KV Cache。這一設(shè)計背后的邏輯在于，F(xiàn)ull Attention在完成自身計算的同時，已經(jīng)生成了KV Cache，并且計算出了最準(zhǔn)確的token重要性信息，后續(xù)的N個Sparse Attention層自然可以直接復(fù)用這些信息。

可以認(rèn)為，HySparse架構(gòu)是在MiMo - V2 - Flash的Hybrid SWA結(jié)構(gòu)基礎(chǔ)上進(jìn)行的優(yōu)化升級。它為SWA增加了全局的、更重要的token信息補充，這一改進(jìn)不僅提升了模型性能，而且沒有增加KV Cache存儲，也沒有顯著增加計算開銷。

目前，小米MiMo團(tuán)隊已計劃在更大規(guī)模的模型上進(jìn)一步驗證HySparse架構(gòu)的極限和潛力。同時，團(tuán)隊還將持續(xù)探索降低Full Attention層數(shù)量的可能性，力求讓超長上下文的處理變得更加高效。HySparse架構(gòu)為Agent時代的超長文本處理提供了高效精準(zhǔn)的技術(shù)解決方案，也為大模型高效注意力結(jié)構(gòu)的研究與落地提供了全新的參考范例。

更多>同類資訊

春晚機(jī)器人成“頂流”！多款被秒搶一空，62萬元高端款也瞬間售罄

如果我們能因為我們的一個作品，帶動了一個產(chǎn)業(yè)的勃興，帶動了一個領(lǐng)域的這種破圈的關(guān)注度，這個我覺得是每一個創(chuàng)作者的榮耀。” 據(jù)悉，從確定仿生人形機(jī)器人要登上春晚開始，僅經(jīng)過兩個多月，松延動力就完成了從全棧自主研…

02-18

春晚“頂流”新歸宿！魔法原子“國寶熊貓機(jī)器人”57527元成交引關(guān)注

買家是一位來自北京的網(wǎng)友，在激烈競價中脫穎而出，將這件融合科技與萌寵元素的頂流“國寶熊貓機(jī)器人”收入囊中。在宜賓分會場，上百臺以“國寶熊貓”造型呈現(xiàn)的“MagicPanda”四足機(jī)器人上演了一場盛大表演，成…

02-18

春節(jié)零號灣“不打烊”：創(chuàng)業(yè)者于假期靜謐中，深挖技術(shù)、打磨產(chǎn)品謀新篇

鉅蛟光電創(chuàng)始人楊佳苗出現(xiàn)在辦公室，從教學(xué)、科研和管理的三重壓力中短暫抽身，他終于能定心坐下來，梳理新一年的學(xué)術(shù)方向與公司戰(zhàn)略。“國外走了幾十年，我們要填補他們在硬件上的優(yōu)勢絕非一日之功，但可以用算法去補償硬件…

02-18

為了更好地了解T90的市場地位，我們將與以下幾款同類產(chǎn)品進(jìn)行詳細(xì)對比：iRobotRoombai7、石頭科技S5Max、360掃地機(jī)器人和小米米家掃地機(jī)器人。總結(jié)來看，科沃斯T90憑借其智能導(dǎo)航、強勁清潔能力…

02-18

B站馬年春晚彈幕破億！“啊？”成熱門，“上B站看春晚”成新儀式

02-18

蘋果加速布局AI可穿戴領(lǐng)域：智能眼鏡、別針吊墜及攝像頭AirPods蓄勢待發(fā)

02-18

谷歌AI搜索功能升級，更突出展示信息來源鏈接

02-18

B站春晚彈幕炸了！1.33億條里年輕人最愛發(fā)的竟是“啊”

02-18

豆包登頂蘋果App Store免費榜此前與春晚聯(lián)動互動總數(shù)達(dá)19億

02-18

消息稱蘋果正研發(fā)三款A(yù)I可穿戴設(shè)備：包括AI智能眼鏡等

02-18

馬斯克官宣 Grok 4.2 公開測試版上線，具備快速學(xué)習(xí)能力

02-18

B站春晚彈幕炸了！1.33億條里年輕人最愛發(fā)的竟是“啊”

02-18

馬年春節(jié)人形機(jī)器人“搶灘”租賃市場，行業(yè)能否借春晚東風(fēng)再起飛？

02-18

特斯拉加州讓步：停用“Autopilot”宣傳，化解與車輛管理局長期糾紛

02-18

谷歌“Project Toscana”人臉識別系統(tǒng)來襲，有望解決低光解鎖難題挑戰(zhàn)蘋果Face ID

02-18

點擊查看更多 +

全站最新

日產(chǎn)奇駿海外煥新登場！澳洲市場燃油混動雙選，售價約18.6萬起

保時捷電動718或生變數(shù) 奧迪高德諾確認(rèn)“下一代TT”開發(fā)穩(wěn)步推進(jìn)

全合成機(jī)油分日系美系？別被誤導(dǎo)！選對關(guān)鍵看發(fā)動機(jī)要求

吉利銀河星耀6新版本亮相工信部，28.3千瓦時電池助力170公里純電續(xù)航

保時捷電動718存變數(shù)，奧迪“下一代TT”開發(fā)推進(jìn)未來可期

奔馳全新概念車亮相，以現(xiàn)代設(shè)計重現(xiàn)1971年“紅豬”傳奇風(fēng)采

熱門內(nèi)容

本欄最新

春節(jié)不打烊：上海零號灣創(chuàng)業(yè)者借“窗口期”深耕技術(shù)，蓄勢待發(fā)迎新程

歲末冬日暖意濃廟壩鎮(zhèn)集體分紅繪就共富新篇章

馬斯克三度確認(rèn)：特斯拉Cybercab 2026年4月投產(chǎn) 初期產(chǎn)能或受限

全新奔馳GLA來襲：純電混動雙選擇，800V架構(gòu)續(xù)航快充雙突破

假期租車出游全攻略：巧用規(guī)則租純電SUV，省錢又便利還超有趣

特斯拉Cybercab首輛量產(chǎn)車下線 2026年量產(chǎn)或成特斯拉產(chǎn)量最高車型

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

小米MiMo發(fā)布HySparse架構(gòu)：為Agent時代超長文本處理帶來高效新方案