阿里云近日在人工智能領(lǐng)域再推重磅成果,正式上線Qwen3.5系列兩款全新大模型——Qwen3.5-Plus與Qwen3.5-397B-A17B。這兩款模型不僅支持文本處理,更突破性地實(shí)現(xiàn)了多模態(tài)任務(wù)處理能力,標(biāo)志著阿里在通用人工智能領(lǐng)域的技術(shù)積累邁入新階段。其中Qwen3.5-Plus作為3.5系列最新力作,Qwen3.5-397B-A17B則以開(kāi)源旗艦定位,為全球開(kāi)發(fā)者提供更強(qiáng)大的技術(shù)底座。
技術(shù)突破方面,Qwen3.5系列實(shí)現(xiàn)底層架構(gòu)的全面革新。Qwen3.5-Plus版本總參數(shù)達(dá)3970億,但通過(guò)動(dòng)態(tài)激活機(jī)制僅需170億參數(shù)即可運(yùn)行,在保持性能超越前代萬(wàn)億參數(shù)模型Qwen3-Max的同時(shí),顯存占用降低60%,推理吞吐量最高提升至19倍。該模型在視覺(jué)-文本聯(lián)合訓(xùn)練數(shù)據(jù)規(guī)模上實(shí)現(xiàn)指數(shù)級(jí)增長(zhǎng),特別強(qiáng)化了中英文、多語(yǔ)言及STEM領(lǐng)域的數(shù)據(jù)質(zhì)量,采用更嚴(yán)格的數(shù)據(jù)過(guò)濾標(biāo)準(zhǔn),確保模型在復(fù)雜場(chǎng)景下的穩(wěn)定性。
開(kāi)源生態(tài)建設(shè)取得實(shí)質(zhì)性進(jìn)展。華為計(jì)算官方宣布,Qwen3.5模型發(fā)布后,昇騰AI團(tuán)隊(duì)在0天內(nèi)完成技術(shù)適配,通過(guò)MindSpeed MM框架實(shí)現(xiàn)基于Atlas 800 A3、Atlas 900 A3SuperPoD等硬件的訓(xùn)練復(fù)現(xiàn)。該框架采用FSDP訓(xùn)練后端設(shè)計(jì),將模型適配周期縮短80%,支持vLLM-Ascend和SGLang兩種推理方案在Atlas 800 A2/A3設(shè)備上的高效部署,為產(chǎn)業(yè)界提供開(kāi)箱即用的開(kāi)發(fā)體驗(yàn)。
性能對(duì)比數(shù)據(jù)顯示,Qwen3.5-397B-A17B在32k/256k上下文長(zhǎng)度下,解碼吞吐量分別達(dá)到Qwen3-Max的8.6倍和19.0倍,較Qwen3-235B-A22B提升3.5倍至7.2倍。多模態(tài)能力方面,該模型通過(guò)早期文本-視覺(jué)融合訓(xùn)練,在相近參數(shù)量級(jí)下顯著優(yōu)于Qwen3-VL。語(yǔ)言支持范圍從119種擴(kuò)展至201種語(yǔ)言及方言,詞匯表擴(kuò)容至25萬(wàn),使多數(shù)語(yǔ)言的編碼解碼效率提升10%-60%。
技術(shù)文檔顯示,Qwen3.5系列采用Qwen3-Next架構(gòu),集成更高稀疏度的MoE(專家混合)機(jī)制、Gated DeltaNet+Gated Attention混合注意力模塊,并通過(guò)穩(wěn)定性優(yōu)化和多token預(yù)測(cè)技術(shù)提升訓(xùn)練效率。目前,開(kāi)發(fā)者可通過(guò)魔樂(lè)社區(qū)、gitcode社區(qū)獲取vLLM部署方案,SGLang社區(qū)提供專用部署指導(dǎo),形成完整的技術(shù)支持鏈條。








