阿里巴巴近日宣布開源全新一代大模型千問Qwen3.5-Plus,該模型在性能上與Gemini 3 Pro不相上下,成為全球開源模型中的佼佼者。此次發布的Qwen3.5-Plus版本總參數高達3970億,但激活參數僅為170億,實現了以小博大的技術突破。其性能不僅超越了萬億參數的Qwen3-Max模型,還在部署顯存占用上降低了60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價格極具競爭力,每百萬Token僅需0.8元,僅為Gemini 3 Pro的1/18。
與前幾代千問大語言模型相比,Qwen3.5-Plus實現了從純文本模型到原生多模態模型的重大轉變。千問3主要在純文本Tokens上進行預訓練,而Qwen3.5-Plus則基于視覺和文本混合token進行預訓練,并大幅增加了中英文、多語言、STEM和推理等數據。這使得模型能夠“睜開眼睛”看世界,掌握更密集的世界知識和推理邏輯。在推理、編程、Agent智能體等全方位基準評估中,Qwen3.5-Plus均表現出色,例如在MMLU-Pro知識推理評測中得分87.8分,超越GPT-5.2;在博士級難題GPQA測評中斬獲88.4分,高于Claude 4.5。
原生多模態訓練也顯著提升了Qwen3.5-Plus的視覺能力。在多模態推理、通用視覺問答VQA、文本識別和文件理解、空間智能、視頻理解等眾多權威評測中,Qwen3.5-Plus均取得了最佳性能。特別是在視頻理解方面,該模型支持長達2小時的視頻直接輸入,適用于長視頻內容分析與摘要生成。同時,Qwen3.5-Plus還實現了視覺理解與代碼能力的原生融合,能夠將手繪界面草圖直接轉為可用的前端代碼,一張截圖就能定位并修復UI問題,極大地提高了視覺編程的效率。
Qwen3.5-Plus性能的飛躍,得益于對Transformer經典架構的重大創新。千問團隊自研的門控技術成果曾獲得全球AI頂會2025 NeurIPS最佳論文,該技術已融入到Qwen3.5-Plus的創新混合架構中。團隊結合線性注意力機制與稀疏混合專家MoE模型架構,實現了397B總參數激活僅17B的極致模型效率。通過訓練穩定優化以及多token預測等系列技術,Qwen3.5-Plus的性能與Qwen3-Max模型持平,并進一步提升了推理效率。在常用的32K上下文場景中,推理吞吐量可提升8.6倍;在256K超長上下文情況下,推理吞吐量最大可提升至19倍。
Qwen3.5-Plus的原生多模態訓練是在阿里云AI基礎設施上高效完成的。通過系列基礎技術創新,該模型在文本、圖像、視頻等混合數據訓練吞吐量上,幾乎與純文本基座模型訓練持平,大大降低了原生多模態訓練的難度門檻。同時,通過設計精巧的FP8、FP32精度應用策略,在訓練穩定擴展到數十萬億個token時,激活內存減少約50%,訓練還能提速10%,進一步節約了模型訓練成本、提升了訓練效率。
基于強大的視覺能力,Qwen3.5-Plus在Agent框架和應用方面也取得了新突破。該模型可自主操作手機與電腦,高效完成日常任務,在移動端支持更多主流APP與指令,在PC端可處理更復雜的多步驟操作,如跨應用數據整理、自動化流程執行等。千問團隊還構建了一個可擴展的Agent異步強化學習框架,端到端可加速3到5倍,并將插件式智能體Agent支持擴展至百萬級規模。1月15日,千問App發布了全球首個消費級AI購物Agent,春節期間6天時間幫用戶完成了1.2億筆訂單,在全球首次實現大規模真實世界任務執行和商業化驗證。
自2023年開源以來,阿里巴巴已開源400多個千問模型,覆蓋全尺寸、全模態,全球下載量突破10億次。單月下載量方面,千問是DeepSeek、meta、OpenAI、智譜、Kimi、MiniMax等2到8名總和,開發者基于千問開發的衍生模型超20萬,成為公認的全球第一開源模型,也是開發者最友好的開源大模型。面向不同國家的AI開發者和企業的需求,千問大模型還在持續演進,Qwen3.5-Plus已擴展支持201種語言,將詞表大小從15萬擴展到25萬,可最高提升小語種60%的編碼效率。據悉,千問APP、PC端已第一時間接入Qwen3.5-Plus模型,開發者可在魔搭社區和HuggingFace下載新模型,或通過阿里云百煉直接獲取API服務。阿里巴巴還將繼續開源不同尺寸、不同功能的千問3.5系列模型,性能更強的旗艦模型Qwen3.5-Max不久也將發布。









