除夕之夜,人工智能領域迎來重磅消息:阿里宣布全新一代開源大模型Qwen3.5-Plus正式發布,憑借多項突破性技術指標登頂開源模型性能榜首。這款總參數達3970億、激活參數僅170億的模型,在保持推理效率優勢的同時,綜合性能超越萬億參數的Qwen3-Max,更在多項基準測試中力壓Gemini-3-Pro、GPT-5.2等閉源模型。
在核心能力維度上,Qwen3.5-Plus展現出全方位突破。MMLU-Pro綜合認知測試中取得87.8分,超越GPT-5.2;博士級科學推理GPQA評測以88.4分刷新紀錄,甚至超越以邏輯嚴謹著稱的Claude 4.5。指令遵循能力方面,該模型在IFBench榜單以76.5分創下新高,Agent協同能力在BFCL-V4和Browsecomp評測中均全面領先Gemini-3-Pro。
技術架構革新是此次突破的關鍵。研發團隊對Transformer架構進行深度重構,引入混合注意力機制實現計算資源動態分配,使長文本處理效率顯著提升;極致稀疏的MoE架構將激活參數比例壓低至5%以下,在保留知識優勢的同時大幅降低推理成本;原生多Token預測機制使推理速度接近翻倍,系統級訓練穩定性優化則解決了超大規模稀疏模型訓練難題。這些創新使模型部署顯存占用降低60%,推理吞吐量提升19倍,訓練成本下降90%。
多模態能力成為最大亮點。作為原生多模態模型,Qwen3.5-Plus在預訓練階段即實現文本與視覺數據的深度融合,突破傳統方案"語言-視覺"分步處理的局限。在MathVison、RealWorldQA等12項多模態評測中包攬全部第一,支持長達2小時視頻的直接輸入與精準分析,更開創性地將視覺理解與代碼生成無縫銜接,可實現手繪界面草圖到前端代碼的自動轉換,以及通過單張截圖定位修復UI缺陷。
實際應用場景中,模型展現出強大泛化能力。面對"50米距離選擇開車還是步行洗車"的邏輯陷阱題,能精準識別"車輛必須到達洗車點"的核心矛盾;在IMO競賽級幾何題測試中,可逐步推導復雜證明過程;動態推理任務中,能規劃滑動方塊的最優移動路徑。更值得關注的是,該模型可與OpenClaw等第三方智能體環境集成,完成網頁搜索、信息收集和結構化報告生成等復雜任務。
開源生態建設持續加速。阿里同步宣布Qwen3.5系列將陸續開源多款適配不同場景的模型版本,覆蓋本地部署、端側應用等需求,旗艦版Qwen3.5-Max也將在年后發布。目前開發者已可通過魔搭社區和HuggingFace平臺獲取模型資源,普通用戶則能在千問APP及PC端免費體驗。為降低使用門檻,阿里云百煉平臺將API定價壓至0.8元/百萬Tokens,僅為Gemini-3-pro的1/18,同時支持201種語言,詞表規模擴展至250k,小語種編碼效率提升60%。
自2023年啟動開源戰略以來,阿里已累計發布400余個模型,形成從0.5B到235B的全尺寸覆蓋體系。這個全球最大的AI模型族群累計下載量突破10億次,單月下載量超過第二至第八名總和,衍生出超過20萬個開發者模型。此次Qwen3.5-Plus的發布,標志著開源模型在性能追趕閉源系統的同時,正通過生態建設構建新的競爭維度。








