螞蟻集團近日宣布開源全球首個基于混合線性架構的萬億參數思考模型Ring-2.5-1T,該模型在生成效率、推理深度和長時程任務執行能力三大核心指標上實現突破性進展,尤其在數學競賽和復雜任務規劃領域達到行業領先水平。
在數學推理能力驗證中,Ring-2.5-1T在國際數學奧林匹克競賽(IMO 2025)自測中取得35分(滿分42分),中國數學奧林匹克(CMO 2025)自測獲得105分(滿分126分),均達到金牌標準。對比前代模型Ring-1T,新模型在推理邏輯嚴謹性、高級數學證明技術應用和答案完整性方面顯著提升。在編程能力測試中,該模型在LiveCodeBench-v6代碼生成基準上超越所有對比模型,展現出強大的邏輯構建能力。
技術架構層面,Ring-2.5-1T采用創新的Ling 2.5混合線性注意力機制,將傳統GQA(分組查詢注意力)升級為MLA(多頭線性注意力)與Lightning Linear結構的1:7組合。這種設計使模型在處理32K以上長文本時,內存訪問開銷降低至前代的十分之一,生成吞吐量提升3倍以上。通過大規模異步智能體強化學習訓練,模型在跨應用工具協作和復雜任務執行方面取得突破,在Gaia2-search智能體搜索任務中達到開源模型最優性能。
性能對比實驗顯示,在配備8塊H20-3e GPU的測試環境中,當生成長度超過16K tokens時,Ring-2.5-1T的解碼吞吐量較Kimi K2架構提升40%以上;在H200 GPU集群上,這一優勢隨著序列長度增加進一步擴大。模型激活參數規模從510億提升至630億,但通過KV緩存壓縮技術,有效控制了計算資源消耗,在1T總參數量下實現更高的推理效率。
該模型已實現與Claude Code智能體編程框架和OpenClaw個人AI助手的深度適配,支持多步規劃與工具調用。在軟件工程任務測試中,Ring-2.5-1T在SWE-Bench Verified基準上取得顯著進步,能夠自主完成代碼調試、依賴管理和跨文件修改等復雜操作。模型權重與推理代碼已在Hugging Face和ModelScope平臺開放下載,官方交互體驗頁面和API服務即將上線。
行業分析指出,Ring-2.5-1T通過底層架構創新,有效解決了傳統模型在處理超長文本時的算力成本高、響應延遲大等問題。其混合線性注意力機制為行業提供了新的技術路徑,在保持模型性能的同時,顯著降低了長序列推理的硬件需求,這對推動AI大模型從短對話向長文檔處理、跨模態分析等場景延伸具有重要意義。











