滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻發布兩大萬億參數開源模型，混合線性架構助力效率性能雙提升

時間：2026-03-01 12:27:37 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在大模型技術快速迭代的當下，如何在提升模型能力的同時有效控制算力消耗，成為行業關注的焦點。螞蟻集團最新發布的百靈大模型家族給出了創新性解決方案：通過混合線性注意力架構，在萬億參數規模下實現效率與性能的雙重突破。

此次發布的Ling-2.5-1T即時模型與Ring-2.5-1T思考模型，均基于自主研發的Ling 2.5架構。該架構突破傳統注意力機制的計算瓶頸，將長文本生成場景的顯存占用壓縮至傳統架構的十分之一，生成吞吐量提升至三倍。這種技術革新使模型在處理復雜任務時，既能保持高精度輸出，又能顯著降低資源消耗。

在數學競賽領域，Ring-2.5-1T展現出卓越實力。該模型在國際數學奧林匹克競賽（IMO 2025）和中國數學奧林匹克（CMO 2025）模擬測試中分別取得35分和105分的優異成績，達到金牌水平。開啟重度思考模式后，其在數學推理和代碼生成基準測試中全面超越同類開源及閉源模型，驗證了混合架構在復雜推理任務中的優勢。

傳統注意力機制雖具備強大的語義理解能力，但隨著文本長度增加，其計算復雜度呈平方級增長。線性注意力通過數學重構將復雜度降至線性水平，但在處理細粒度語義對齊時存在局限。混合架構通過分層分工策略，在關鍵層保留傳統注意力機制，其余層采用線性計算，實現計算效率與表達能力的動態平衡。

實現萬億參數規模的混合架構面臨多重挑戰。研究團隊通過分組混合設計，在每個層組中配置7層線性注意力與1層傳統注意力，經實驗驗證該比例在高計算預算下性能更優。針對訓練穩定性問題，開發團隊設計出自適應重計算量化技術，將FP8混合精度訓練效率提升50%至70%。推理端則通過優化線性注意力融合算子，支持更多推理模式，進一步提升吞吐量。

在架構改造過程中，研究團隊保留了QK歸一化、部分旋轉位置編碼等關鍵機制，確保模型遷移過程中表達能力不衰減。改造后的Ling-2.5-1T激活參數從510億增至630億，但推理吞吐量仍顯著提升，證明架構優化收益超過參數增長帶來的負擔。通過持續預訓練和上下文窗口擴展訓練，該模型支持最高100萬token的超長文本處理。

基準測試數據顯示，在AIME 2026評測中，Ling-2.5-1T以平均5890個token的輸出長度逼近前沿思考模型水平，而后者需要生成1.5萬至2.3萬個token才能完成同等任務。在長文本處理基準測試中，該模型在16K至256K token范圍內表現優于采用MLA/DSA架構的主流模型。工程實踐驗證顯示，在單機8卡H200配置下，其長文本生成解碼吞吐量顯著優于前代模型及同等參數量的競品。

實際應用場景中，優化后的長上下文能力使模型能夠處理復雜法律文書和財報分析任務。在知識產權質押糾紛案例中，模型嚴格遵循10余項多維指令約束，生成邏輯連貫的答復；在財報解讀場景中，可一次性完成數十頁文檔的信息抽取和財務指標計算。這些能力為企業級智能體構建和知識處理自動化提供了技術支撐。

更多>同類資訊

西北零碳智慧云智算中心一期開工助力慶陽大數據產業邁向新高度

2月28日，西北零碳智慧云智算中心一期項目開工活動在慶陽東數西算產業園區舉行。該項目是慶陽東數西算產業園區落地實施的標桿性算力中心，由慶陽市審計局招引落地，由超算數字科技（甘肅）有限公司全額投資建設運營，占…

03-01

春節“千元豆”AI應用表現亮眼千問DAU激增且下單量近2億次

QuestMobile數據顯示，春節期間“千元豆”三大AI 應用創DAU新高，豆包、千問、元寶的峰值分別為1.45億、7352萬、4054萬，千問拿下940%的最高增幅。2月7日千問DAU達7352萬，活動…

03-01

英偉達計劃推新處理器聚焦AI推理計算助力OpenAI等提升系統效率

據《華爾街日報》援引知情人士消息，全球芯片巨頭英偉達正計劃推出一款新型處理器，旨在助力OpenAI等客戶構建速度更快、效率更高的AI系統。知情人士進一步披露，為加速推理計算能力，ChatGPT開發商Ope…

03-01

Block公司因AI變革計劃裁員40% 股價不降反升未來結構性調整成趨勢

當地時間2月26日，由杰克·多西(Jack Dorsey)創立、旗下擁有Square和CashApp的支付公司Block表示，計劃裁員40%，即超過4000名員工，員工總數將從約1萬人降至不足6000人。 …

03-01

全國政協委員肖新光：以技術創新引領共筑AI時代國家安全新屏障

基于對行業痛點與國際形勢的洞察和充分調研，肖新光提出，應對人工智能時代的安全挑戰，關鍵要發揮制度優勢，打造國家主導、戰略企業研發、產業廣泛應用的“人工智能+”國家安全技術引擎。他建議，以網絡安全反病毒引擎等…

03-01

澳大利亞公司推首款商用活體神經元計算機，以真實神經元運行經典游戲

IT之家 3 月 1 日消息，據 Techspot 報道，澳大利亞生物技術初創公司 Cortical Labs在生物計算領域再次實現重大突破，其最新硬件平臺 CL1 以活體人類神經元作為完整功能計算機的核心…

03-01

榮耀MWC2026將展全球首款機器人手機ROBOT PHONE 今年或量產入市引期待

03-01

零跑汽車2月交付28067臺零跑A10即將預售 2026年上半年批量交付

03-01

澳大利亞生物技術突破：人類活體神經元計算機問世，暢玩經典游戲《毀滅戰士》

03-01

零跑汽車2月交付28067臺創新高 A10即將預售續航超500km配置豐富

03-01

澳大利亞公司打造人類活體神經元計算機

03-01

我國首個覆蓋全產業鏈的人形機器人標準體系發布助力產業高質量發展

基礎共性標準是通用性、指導性的標準和規范，為技術演進和發展提供合規保障；類腦與智算標準覆蓋具身智能“大小腦”與智能計算等關鍵標準，規范數據全生命周期、模型訓推部署全鏈路技術；肢體與部組件標準包含類人軀干、臂與…

03-01

23.8萬億元背后的中國力量：網絡零售惠民利全球，未來更可期

03-01

中國AI大模型調用量首超美國：國產大模型崛起，應用前景未來可期

03-01

復興島打造無形大學：AI時代下城市與知識融合的共生新圖景

03-01

點擊查看更多 +

全站最新

馬年新春送禮指南：訊飛AI錄音筆Pokee，職場新人的貼心高效之選

廣州單車盈利驗證小馬智行Robotaxi模式，北京亦莊商業化仍待突破瓶頸

小米汽車2026年2月成績亮眼交付量突破兩萬臺大關

小米神秘超跑將全球首發！MWC2026前夕亮相，或為中國新能源高端破局

雷軍直播揭秘新SU7安全設計：三重電源防護+機械門把手，安全目標直指同檔最優

雷軍預告明日揭曉驚喜，小米汽車或攜超級跑車概念車亮相MWC 2026

熱門內容

本欄最新

零跑汽車2月交付28067臺零跑A10即將預售 2026年上半年批量交付

零跑汽車2月交付28067臺創新高 A10即將預售續航超500km配置豐富

2025款別克E5：17萬級合資純電新選擇，大空間強續航駕控出色

中國科研突破！新型電池低溫續航強勁，能量密度飆升或改寫新能源格局

中國科研再突破！新型電池低溫續航強，或為新能源領域帶來新變革

中國科研新突破：新型電解液助力電動車續航破千公里且無懼極寒

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻發布兩大萬億參數開源模型，混合線性架構助力效率性能雙提升