阿里巴巴旗下千問團(tuán)隊(duì)近日發(fā)布了一款名為Qwen3-Coder-Next的開放權(quán)重語(yǔ)言模型,該模型專為編碼代理和本地開發(fā)場(chǎng)景設(shè)計(jì),通過創(chuàng)新架構(gòu)與訓(xùn)練方法實(shí)現(xiàn)了性能與效率的雙重突破。相較于傳統(tǒng)模型依賴參數(shù)規(guī)模擴(kuò)張的策略,Qwen3-Coder-Next采用混合注意力機(jī)制與專家混合(MoE)架構(gòu),在保持30億激活參數(shù)的輕量化設(shè)計(jì)下,展現(xiàn)出與參數(shù)量高10-20倍模型相當(dāng)?shù)木幊棠芰Α?/p>
模型訓(xùn)練體系突破了常規(guī)預(yù)訓(xùn)練框架,構(gòu)建了四層遞進(jìn)式強(qiáng)化機(jī)制:首先在代碼與智能體交互數(shù)據(jù)上進(jìn)行持續(xù)預(yù)訓(xùn)練,隨后通過高質(zhì)量智能體軌跡數(shù)據(jù)開展監(jiān)督微調(diào),進(jìn)而針對(duì)軟件工程、問答系統(tǒng)、Web開發(fā)等垂直領(lǐng)域?qū)嵤<矣?xùn)練,最終將多領(lǐng)域能力蒸餾整合至統(tǒng)一模型。這種訓(xùn)練范式特別強(qiáng)化了長(zhǎng)程推理、工具調(diào)用和錯(cuò)誤恢復(fù)能力,使模型能夠從環(huán)境反饋中自主學(xué)習(xí)編程邏輯。
在權(quán)威編程智能體基準(zhǔn)測(cè)試中,該模型展現(xiàn)出顯著優(yōu)勢(shì)。使用SWE-Agent框架時(shí),在SWE-Bench Verified測(cè)試集上取得超過70%的準(zhǔn)確率,在多語(yǔ)言版本和更具挑戰(zhàn)性的Pro版本中仍保持競(jìng)爭(zhēng)力。特別值得注意的是,在SWE-Bench-Pro測(cè)試中,其性能表現(xiàn)與參數(shù)量大數(shù)十倍的開源模型持平,而推理成本顯著降低。TerminalBench 2.0和Aider等基準(zhǔn)測(cè)試結(jié)果也驗(yàn)證了模型在終端交互和代碼輔助場(chǎng)景中的實(shí)用性。
效率與性能的平衡是該模型的核心創(chuàng)新點(diǎn)。通過動(dòng)態(tài)參數(shù)激活機(jī)制,模型在處理不同任務(wù)時(shí)僅調(diào)用必要專家模塊,既保證了復(fù)雜任務(wù)的處理能力,又避免了全量參數(shù)運(yùn)算的資源消耗。這種設(shè)計(jì)使其在面向邊緣計(jì)算和低成本設(shè)備部署時(shí)具有顯著優(yōu)勢(shì),為智能體技術(shù)的普及應(yīng)用開辟了新路徑。
目前,Qwen3-Coder-Next已通過ModelScope和Hugging Face平臺(tái)開放下載,開發(fā)社區(qū)可自由獲取模型權(quán)重進(jìn)行二次開發(fā)。團(tuán)隊(duì)透露后續(xù)將重點(diǎn)優(yōu)化模型的自主決策能力,擴(kuò)展支持更多開發(fā)工具鏈,并建立基于用戶反饋的持續(xù)迭代機(jī)制,推動(dòng)編程智能體向更復(fù)雜的任務(wù)管理場(chǎng)景延伸。









