阿里巴巴近日宣布開源新一代大模型千問Qwen3.5-Plus,其性能已達(dá)到國際頂尖水平,可與Gemini 3Pro相媲美。這一成果標(biāo)志著中國在開源大模型領(lǐng)域再次取得重大突破,成為全球開發(fā)者關(guān)注的焦點(diǎn)。該模型總參數(shù)達(dá)3970億,但實(shí)際激活參數(shù)僅170億,通過創(chuàng)新架構(gòu)實(shí)現(xiàn)了以小博大的技術(shù)突破,不僅性能超越萬億參數(shù)的Qwen3-Max模型,還將部署顯存占用降低60%,推理效率顯著提升,最大推理吞吐量可達(dá)原模型的19倍。
在基準(zhǔn)測試中,千問3.5-Plus展現(xiàn)出了卓越的綜合能力。MMLU-Pro知識推理評測得分87.8分,超越GPT-5.2;博士級難題GPQA測評斬獲88.4分,高于Claude 4.5;指令遵循IFBench以76.5分刷新紀(jì)錄。在通用Agent評測BFCL-V4和搜索Agent評測Browsecomp等專項(xiàng)測試中,其表現(xiàn)均優(yōu)于Gemini 3 Pro和GPT-5.2。更令人矚目的是,該模型API價(jià)格每百萬Token僅0.8元,僅為Gemini 3Pro的十八分之一,大幅降低了開發(fā)者的使用成本。
技術(shù)層面,千問3.5-Plus實(shí)現(xiàn)了從純文本到原生多模態(tài)的代際躍遷。通過視覺和文本混合token預(yù)訓(xùn)練,模型新增了大量中英文、多語言、STEM和推理數(shù)據(jù),使其具備更強(qiáng)的世界知識理解和推理能力。在多模態(tài)推理、通用視覺問答、文本識別、空間智能、視頻理解等權(quán)威評測中均取得最佳成績。特別是在視頻理解方面,該模型支持長達(dá)2小時(shí)的視頻直接輸入,適用于長視頻內(nèi)容分析與摘要生成,為視頻處理領(lǐng)域帶來新的可能性。
視覺編程能力的突破是千問3.5-Plus的另一大亮點(diǎn)。該模型實(shí)現(xiàn)了視覺理解與代碼能力的原生融合,結(jié)合圖搜和生圖工具,可將手繪界面草圖直接轉(zhuǎn)換為可用的前端代碼,還能通過截圖定位并修復(fù)UI問題。這種能力使視覺編程真正成為生產(chǎn)力工具,為開發(fā)者提供了更高效的工作方式。在學(xué)科解題、任務(wù)規(guī)劃與物理空間推理等任務(wù)上,其表現(xiàn)優(yōu)于千問專項(xiàng)模型Qwen3-VL,空間定位推理和帶圖推理能力顯著增強(qiáng)。
模型效率的提升得益于對Transformer架構(gòu)的創(chuàng)新突破。千問團(tuán)隊(duì)將自研的門控技術(shù)(曾獲2025NeurIPS最佳論文)與線性注意力機(jī)制、稀疏混合專家MoE模型架構(gòu)相結(jié)合,實(shí)現(xiàn)了397B總參數(shù)激活僅17B的極致效率。通過訓(xùn)練穩(wěn)定優(yōu)化和多token預(yù)測等技術(shù),千問3.5-Plus在32K上下文場景中推理吞吐量提升8.6倍,在256K超長上下文情況下最大提升19倍,推理效率達(dá)到行業(yè)領(lǐng)先水平。
這些技術(shù)突破離不開阿里云AI基礎(chǔ)設(shè)施的支持。千問3.5-Plus在文本、圖像、視頻等混合數(shù)據(jù)訓(xùn)練吞吐量上,幾乎與純文本基座模型持平,大幅降低了原生多模態(tài)訓(xùn)練的難度。通過精巧的FP8、FP32精度應(yīng)用策略,模型在訓(xùn)練穩(wěn)定擴(kuò)展到數(shù)十萬億個(gè)token時(shí),激活內(nèi)存減少約50%,訓(xùn)練速度提升10%,有效節(jié)約了訓(xùn)練成本。
在應(yīng)用層面,千問3.5-Plus已展現(xiàn)出強(qiáng)大的商業(yè)化潛力。基于該模型的AI購物Agent在春節(jié)期間6天內(nèi)幫助用戶完成1.2億筆訂單,實(shí)現(xiàn)了大規(guī)模真實(shí)世界任務(wù)執(zhí)行和商業(yè)化驗(yàn)證。該Agent可自主操作手機(jī)與電腦,支持更多主流APP與指令,在PC端能處理復(fù)雜的多步驟操作,如跨應(yīng)用數(shù)據(jù)整理和自動化流程執(zhí)行。千問團(tuán)隊(duì)還構(gòu)建了可擴(kuò)展的Agent異步強(qiáng)化學(xué)習(xí)框架,端到端加速3到5倍,插件式智能體支持?jǐn)U展至百萬級規(guī)模。
自2023年開源以來,阿里已推出400多個(gè)千問模型,覆蓋全尺寸、全模態(tài),全球下載量突破10億次,單月下載量超過DeepSeek、meta、OpenAI等企業(yè)2至8名的總和。開發(fā)者基于千問開發(fā)的衍生模型超過20萬個(gè),使其成為公認(rèn)的全球第一開源模型。為滿足不同國家開發(fā)者和企業(yè)的需求,千問3.5-Plus擴(kuò)展支持201種語言,詞表大小從15萬擴(kuò)展到25萬,小語種編碼效率最高提升60%。目前,千問APP和PC端已接入新模型,開發(fā)者可在魔搭社區(qū)和HuggingFace下載,或通過阿里云百煉獲取API服務(wù)。阿里計(jì)劃繼續(xù)開源不同尺寸、功能的千問3.5系列模型,性能更強(qiáng)的旗艦?zāi)P蚎wen3.5-Max也將于近期發(fā)布。










