除夕夜,阿里巴巴宣布正式開源新一代千問大模型千問3.5(Qwen3.5-Plus),這是繼Qwen2.5-Max發(fā)布后,該公司在人工智能領域的又一重要突破。目前,千問APP與PC端(qianwen.com)已同步上線,用戶可通過頁面頂部選擇新一代模型,體驗其強大能力。
與前代模型不同,千問3.5實現(xiàn)了從純文本模型到原生多模態(tài)模型的底層架構重構。在預訓練階段,該模型基于視覺和文本混合token進行訓練,視覺理解能力不再作為外掛模塊存在,而是與語言能力在底層共同建模。模型大幅增加了中英文、201種語言與方言、STEM學科及推理等數(shù)據(jù),突破了以往的數(shù)據(jù)局限性,使模型能夠處理更密集的世界知識和推理邏輯。
千問3.5在參數(shù)效率方面表現(xiàn)尤為突出。通過架構優(yōu)化,該模型以少于40%的參數(shù)量實現(xiàn)了超萬億參數(shù)的Qwen3-Max基座模型的高性能。這一成果得益于千問團隊自研的門控注意力技術,該技術曾獲2025年NeurIPS全球AI頂會最佳論文,并被應用于千問3.5的混合架構中。結合線性注意力機制和稀疏混合專家(MoE)模型架構,千問3.5實現(xiàn)了“高參數(shù)、低激活”的結構,總參數(shù)規(guī)模達397B,但每次推理僅激活17B參數(shù),顯著提升了推理效率。
在性能評估方面,千問3.5在多項基準測試中表現(xiàn)優(yōu)異。在指令遵循IFBench測試中,該模型以76.5分刷新紀錄;在MMLU-Pro知識推理評測中,得分87.8,超越GPT-5.2;在博士級難題GPQA測評中,得分88.4,高于Claude 4.5,但與GPT-5.2和Gemini 3 Pro仍有差距。在通用Agent評測BFCL-V4和搜索Agent評測Browsecomp中,千問3.5的性能優(yōu)于Gemini 3 Pro和GPT-5.2。
原生多模態(tài)訓練為千問3.5的視覺能力帶來顯著提升。在多模態(tài)推理(MathVison)、通用視覺問答VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等權威測評中,千問3.5均達到最佳性能。這表明,該模型已不再局限于“語言強、視覺補”的模式,而是形成了統(tǒng)一架構下的完整能力矩陣。
在推理效率方面,千問3.5通過訓練穩(wěn)定優(yōu)化和多token預測等技術,實現(xiàn)了性能比肩Qwen3-Max的同時,進一步提升了推理效率。在32K上下文場景中,推理吞吐量提升8.6倍;在256K超長上下文中,推理吞吐量最大提升19倍。這一提升使得長文本分析、復雜推理和Agent調(diào)度等場景的成本和延遲大幅降低。
基于優(yōu)異的視覺能力,千問3.5在Agent應用領域取得突破性進展。該模型能夠自主操作手機和電腦,高效完成日常任務,支持更多主流APP和指令。在PC端,千問3.5可處理更復雜的多步驟操作,包括跨應用數(shù)據(jù)整理和自動化流程執(zhí)行。千問團隊構建了可擴展的Agent異步強化學習框架,使端到端加速提升3至5倍,并將插件式智能體支持擴展至百萬級規(guī)模,標志著千問從對話模型向行動模型的過渡。
據(jù)千問團隊透露,下一階段的研究重點將從模型規(guī)模轉(zhuǎn)向系統(tǒng)整合,包括構建具備跨會話持久記憶的智能體、開發(fā)面向真實世界交互的具身接口,以及探索自我改進機制。這一轉(zhuǎn)變反映了全球大模型競爭的新趨勢——從單純追求“更大、更準”轉(zhuǎn)向“更高效、更可執(zhí)行”。千問3.5的發(fā)布,標志著這場關于模型效率的革命已經(jīng)拉開帷幕。











