阿里巴巴旗下千問團隊近日發布了一款名為Qwen3-Coder-Next的全新語言模型,該模型專為編碼代理和本地開發場景設計,采用開放權重架構,旨在為開發者提供更高效的編程工具。與傳統的參數擴展模式不同,Qwen3-Coder-Next通過創新訓練方法,在降低推理成本的同時顯著提升了編程和智能體能力。
該模型基于Qwen3-Next-80B-A3B-Base構建,引入了混合注意力機制與專家混合(MoE)架構。訓練過程中,團隊采用大規模可執行任務合成、環境交互和強化學習技術,使模型能夠直接從環境反饋中學習。具體訓練方法包括:在代碼與智能體數據上進行持續預訓練,利用高質量智能體軌跡數據進行監督微調,針對軟件工程、QA、Web/UX等領域進行專家訓練,最終將專家能力蒸餾到單一可部署模型中。這種訓練方式特別強調長程推理、工具使用和錯誤恢復能力,這些特性對現實編程場景至關重要。
在性能評估方面,Qwen3-Coder-Next在多個權威編程智能體基準測試中表現優異。使用SWE-Agent框架時,該模型在SWE-Bench Verified基準上取得超過70%的成績,在多語言設置和更具挑戰性的SWE-Bench-Pro測試中也保持競爭力。值得注意的是,盡管其激活參數規模較小,但在多項評測中仍能媲美甚至超越參數規模大10-20倍的開源模型。
效率與性能的平衡是該模型的另一大亮點。測試數據顯示,Qwen3-Coder-Next(3B激活參數)在SWE-Bench-Pro測試中的表現可與參數量大數十倍的模型相提并論。雖然全注意力模型在絕對性能上仍具優勢,但Qwen3-Coder-Next在低成本智能體部署領域展現出明顯的效率優勢,處于帕累托前沿位置。這種特性使其特別適合需要快速響應和資源優化的開發場景。
目前,Qwen3-Coder-Next已通過ModelScope和Hugging Face平臺開源,開發者可以自由獲取模型權重和相關文檔。千問團隊表示,后續將持續優化模型的推理決策能力,擴展支持的任務類型,并根據用戶反饋進行快速迭代,為編程智能體領域帶來更多創新解決方案。








