除夕之夜,人工智能領(lǐng)域迎來重磅消息:阿里宣布全新一代開源大模型Qwen3.5-Plus正式發(fā)布,憑借多項(xiàng)突破性技術(shù)指標(biāo)登頂開源模型性能榜首。這款總參數(shù)達(dá)3970億、激活參數(shù)僅170億的模型,在保持推理效率優(yōu)勢的同時(shí),綜合性能超越萬億參數(shù)的Qwen3-Max,更在多項(xiàng)基準(zhǔn)測試中力壓Gemini-3-Pro、GPT-5.2等閉源模型。
在核心能力維度上,Qwen3.5-Plus展現(xiàn)出全方位突破。MMLU-Pro綜合認(rèn)知測試中取得87.8分,超越GPT-5.2;博士級科學(xué)推理GPQA評測以88.4分刷新紀(jì)錄,甚至超越以邏輯嚴(yán)謹(jǐn)著稱的Claude 4.5。指令遵循能力方面,該模型在IFBench榜單以76.5分創(chuàng)下新高,Agent協(xié)同能力在BFCL-V4和Browsecomp評測中均全面領(lǐng)先Gemini-3-Pro。
技術(shù)架構(gòu)革新是此次突破的關(guān)鍵。研發(fā)團(tuán)隊(duì)對Transformer架構(gòu)進(jìn)行深度重構(gòu),引入混合注意力機(jī)制實(shí)現(xiàn)計(jì)算資源動(dòng)態(tài)分配,使長文本處理效率顯著提升;極致稀疏的MoE架構(gòu)將激活參數(shù)比例壓低至5%以下,在保留知識(shí)優(yōu)勢的同時(shí)大幅降低推理成本;原生多Token預(yù)測機(jī)制使推理速度接近翻倍,系統(tǒng)級訓(xùn)練穩(wěn)定性優(yōu)化則解決了超大規(guī)模稀疏模型訓(xùn)練難題。這些創(chuàng)新使模型部署顯存占用降低60%,推理吞吐量提升19倍,訓(xùn)練成本下降90%。
多模態(tài)能力成為最大亮點(diǎn)。作為原生多模態(tài)模型,Qwen3.5-Plus在預(yù)訓(xùn)練階段即實(shí)現(xiàn)文本與視覺數(shù)據(jù)的深度融合,突破傳統(tǒng)方案"語言-視覺"分步處理的局限。在MathVison、RealWorldQA等12項(xiàng)多模態(tài)評測中包攬全部第一,支持長達(dá)2小時(shí)視頻的直接輸入與精準(zhǔn)分析,更開創(chuàng)性地將視覺理解與代碼生成無縫銜接,可實(shí)現(xiàn)手繪界面草圖到前端代碼的自動(dòng)轉(zhuǎn)換,以及通過單張截圖定位修復(fù)UI缺陷。
實(shí)際應(yīng)用場景中,模型展現(xiàn)出強(qiáng)大泛化能力。面對"50米距離選擇開車還是步行洗車"的邏輯陷阱題,能精準(zhǔn)識(shí)別"車輛必須到達(dá)洗車點(diǎn)"的核心矛盾;在IMO競賽級幾何題測試中,可逐步推導(dǎo)復(fù)雜證明過程;動(dòng)態(tài)推理任務(wù)中,能規(guī)劃滑動(dòng)方塊的最優(yōu)移動(dòng)路徑。更值得關(guān)注的是,該模型可與OpenClaw等第三方智能體環(huán)境集成,完成網(wǎng)頁搜索、信息收集和結(jié)構(gòu)化報(bào)告生成等復(fù)雜任務(wù)。
開源生態(tài)建設(shè)持續(xù)加速。阿里同步宣布Qwen3.5系列將陸續(xù)開源多款適配不同場景的模型版本,覆蓋本地部署、端側(cè)應(yīng)用等需求,旗艦版Qwen3.5-Max也將在年后發(fā)布。目前開發(fā)者已可通過魔搭社區(qū)和HuggingFace平臺(tái)獲取模型資源,普通用戶則能在千問APP及PC端免費(fèi)體驗(yàn)。為降低使用門檻,阿里云百煉平臺(tái)將API定價(jià)壓至0.8元/百萬Tokens,僅為Gemini-3-pro的1/18,同時(shí)支持201種語言,詞表規(guī)模擴(kuò)展至250k,小語種編碼效率提升60%。
自2023年啟動(dòng)開源戰(zhàn)略以來,阿里已累計(jì)發(fā)布400余個(gè)模型,形成從0.5B到235B的全尺寸覆蓋體系。這個(gè)全球最大的AI模型族群累計(jì)下載量突破10億次,單月下載量超過第二至第八名總和,衍生出超過20萬個(gè)開發(fā)者模型。此次Qwen3.5-Plus的發(fā)布,標(biāo)志著開源模型在性能追趕閉源系統(tǒng)的同時(shí),正通過生態(tài)建設(shè)構(gòu)建新的競爭維度。










