阿里巴巴旗下千問(wèn)團(tuán)隊(duì)近日發(fā)布了一款名為Qwen3-Coder-Next的開(kāi)放權(quán)重語(yǔ)言模型,該模型專(zhuān)為編碼代理和本地開(kāi)發(fā)場(chǎng)景設(shè)計(jì),通過(guò)創(chuàng)新架構(gòu)與訓(xùn)練方法實(shí)現(xiàn)了性能與效率的雙重突破。基于Qwen3-Next-80B-A3B-Base構(gòu)建的混合注意力與MoE架構(gòu),使模型在保持低推理成本的同時(shí),展現(xiàn)出強(qiáng)大的編程和智能體能力。
與傳統(tǒng)依賴(lài)參數(shù)擴(kuò)展的模型不同,Qwen3-Coder-Next聚焦于智能體訓(xùn)練信號(hào)的擴(kuò)展。研發(fā)團(tuán)隊(duì)采用大規(guī)模可驗(yàn)證編程任務(wù)與可執(zhí)行環(huán)境進(jìn)行訓(xùn)練,使模型能夠直接從環(huán)境反饋中學(xué)習(xí)。訓(xùn)練過(guò)程包含四個(gè)關(guān)鍵階段:在代碼與智能體數(shù)據(jù)上進(jìn)行持續(xù)預(yù)訓(xùn)練,在高質(zhì)量智能體軌跡數(shù)據(jù)上開(kāi)展監(jiān)督微調(diào),針對(duì)軟件工程、QA、Web/UX等領(lǐng)域進(jìn)行專(zhuān)家訓(xùn)練,最后將專(zhuān)家能力蒸餾至單一可部署模型。這種訓(xùn)練方式特別強(qiáng)化了長(zhǎng)程推理、工具使用和執(zhí)行失敗恢復(fù)能力,這些特性對(duì)現(xiàn)實(shí)編程場(chǎng)景至關(guān)重要。
在編程智能體基準(zhǔn)測(cè)試中,Qwen3-Coder-Next展現(xiàn)出顯著優(yōu)勢(shì)。使用SWE-Agent框架時(shí),該模型在SWE-Bench Verified基準(zhǔn)上取得超過(guò)70%的成績(jī),在多語(yǔ)言設(shè)置和更具挑戰(zhàn)性的SWE-Bench-Pro測(cè)試中保持競(jìng)爭(zhēng)力。值得注意的是,盡管其激活參數(shù)規(guī)模較小,但在多項(xiàng)評(píng)測(cè)中仍能比肩甚至超越參數(shù)規(guī)模大10-20倍的開(kāi)源模型。特別是在TerminalBench 2.0和Aider等基準(zhǔn)測(cè)試中,模型證明了其在復(fù)雜編程任務(wù)中的實(shí)用價(jià)值。
效率與性能的平衡是該模型的另一大亮點(diǎn)。測(cè)試數(shù)據(jù)顯示,3B激活參數(shù)版本的Qwen3-Coder-Next在SWE-Bench-Pro上的表現(xiàn),可與激活參數(shù)量高10-20倍的模型相媲美。雖然專(zhuān)有全注意力模型在絕對(duì)性能上仍占優(yōu)勢(shì),但Qwen3-Coder-Next在低成本智能體部署場(chǎng)景中展現(xiàn)出明顯的帕累托前沿優(yōu)勢(shì),為資源受限環(huán)境下的編程智能體應(yīng)用提供了新選擇。
目前,Qwen3-Coder-Next已通過(guò)ModelScope和Hugging Face平臺(tái)開(kāi)源,開(kāi)發(fā)者可自由獲取模型權(quán)重及相關(guān)文檔。研發(fā)團(tuán)隊(duì)表示,后續(xù)將重點(diǎn)提升模型的推理決策能力,擴(kuò)展任務(wù)支持范圍,并根據(jù)用戶(hù)反饋持續(xù)優(yōu)化模型性能。這一創(chuàng)新成果有望推動(dòng)編程智能體在軟件開(kāi)發(fā)、自動(dòng)化測(cè)試等領(lǐng)域的廣泛應(yīng)用。











