阿里近日在chat.qwen.ai平臺(tái)悄然推出兩款全新大語言模型——Qwen3.5-Plus與Qwen3.5-397B-A17B,標(biāo)志著其在多模態(tài)人工智能領(lǐng)域的技術(shù)突破。這兩款模型不僅延續(xù)了Qwen系列對(duì)文本與多模態(tài)任務(wù)的支持,更通過底層架構(gòu)革新實(shí)現(xiàn)了性能與效率的雙重躍升。
作為Qwen3.5系列的最新迭代,Qwen3.5-Plus總參數(shù)規(guī)模達(dá)3970億,但每次推理僅激活170億參數(shù)。這種創(chuàng)新設(shè)計(jì)使其在保持萬億參數(shù)模型性能的同時(shí),將顯存占用降低60%,推理吞吐量最高提升至19倍。該模型通過更嚴(yán)格的訓(xùn)練數(shù)據(jù)過濾機(jī)制,強(qiáng)化了中英文、多語言及STEM領(lǐng)域的知識(shí)儲(chǔ)備,在復(fù)雜邏輯推理任務(wù)中展現(xiàn)出超越前代Qwen3-Max的實(shí)力。
開源旗艦?zāi)P蚎wen3.5-397B-A17B則采用混合架構(gòu)設(shè)計(jì),將線性注意力機(jī)制與稀疏混合專家模型相結(jié)合。這種架構(gòu)使其在編程、智能體交互及多模態(tài)理解等基準(zhǔn)測(cè)試中表現(xiàn)卓越,解碼效率較前代提升顯著:在32k上下文長(zhǎng)度下,解碼速度是Qwen3-Max的8.6倍;256k上下文長(zhǎng)度下更達(dá)到19倍提升。語言支持范圍從119種擴(kuò)展至201種,覆蓋全球主要語言及方言群體。
技術(shù)團(tuán)隊(duì)透露,Qwen3.5系列在預(yù)訓(xùn)練階段實(shí)現(xiàn)了三大突破:在能力維度,通過擴(kuò)大視覺-文本語料規(guī)模并優(yōu)化數(shù)據(jù)過濾標(biāo)準(zhǔn),使397B模型在多項(xiàng)基準(zhǔn)測(cè)試中與參數(shù)量超1萬億的Qwen3-Max-Base持平;效率維度,基于Qwen3-Next架構(gòu)引入更高稀疏度的MoE機(jī)制,配合混合注意力模塊,在保持性能的同時(shí)大幅降低計(jì)算資源消耗;通用性維度,通過原生多模態(tài)設(shè)計(jì)使模型天然具備文本、圖像、視頻的綜合處理能力,25萬詞表較前代提升66%的編碼效率。
據(jù)開發(fā)團(tuán)隊(duì)介紹,Qwen3.5系列已為構(gòu)建通用數(shù)字智能體奠定技術(shù)基礎(chǔ)。未來研發(fā)重點(diǎn)將轉(zhuǎn)向系統(tǒng)整合層面,包括開發(fā)具備跨會(huì)話記憶能力的智能體框架、設(shè)計(jì)面向物理世界交互的具身接口,以及建立自我改進(jìn)機(jī)制。這些創(chuàng)新旨在突破傳統(tǒng)任務(wù)型助手的局限,打造能夠長(zhǎng)期自主運(yùn)行、保持邏輯一致性的可信人工智能伙伴。










