阿里近日在chat.qwen.ai平臺悄然推出兩款全新大語言模型——Qwen3.5-Plus與Qwen3.5-397B-A17B,標志著其在多模態人工智能領域的技術突破。這兩款模型不僅延續了Qwen系列對文本與多模態任務的支持,更通過底層架構革新實現了性能與效率的雙重躍升。
作為Qwen3.5系列的最新迭代,Qwen3.5-Plus總參數規模達3970億,但每次推理僅激活170億參數。這種創新設計使其在保持萬億參數模型性能的同時,將顯存占用降低60%,推理吞吐量最高提升至19倍。該模型通過更嚴格的訓練數據過濾機制,強化了中英文、多語言及STEM領域的知識儲備,在復雜邏輯推理任務中展現出超越前代Qwen3-Max的實力。
開源旗艦模型Qwen3.5-397B-A17B則采用混合架構設計,將線性注意力機制與稀疏混合專家模型相結合。這種架構使其在編程、智能體交互及多模態理解等基準測試中表現卓越,解碼效率較前代提升顯著:在32k上下文長度下,解碼速度是Qwen3-Max的8.6倍;256k上下文長度下更達到19倍提升。語言支持范圍從119種擴展至201種,覆蓋全球主要語言及方言群體。
技術團隊透露,Qwen3.5系列在預訓練階段實現了三大突破:在能力維度,通過擴大視覺-文本語料規模并優化數據過濾標準,使397B模型在多項基準測試中與參數量超1萬億的Qwen3-Max-Base持平;效率維度,基于Qwen3-Next架構引入更高稀疏度的MoE機制,配合混合注意力模塊,在保持性能的同時大幅降低計算資源消耗;通用性維度,通過原生多模態設計使模型天然具備文本、圖像、視頻的綜合處理能力,25萬詞表較前代提升66%的編碼效率。
據開發團隊介紹,Qwen3.5系列已為構建通用數字智能體奠定技術基礎。未來研發重點將轉向系統整合層面,包括開發具備跨會話記憶能力的智能體框架、設計面向物理世界交互的具身接口,以及建立自我改進機制。這些創新旨在突破傳統任務型助手的局限,打造能夠長期自主運行、保持邏輯一致性的可信人工智能伙伴。











