阿里千問近日宣布正式開源四款全新小尺寸模型,涵蓋Qwen3.5-0.8B、2B、4B及9B四個版本。這系列模型延續了Qwen3.5家族的技術優勢,通過原生多模態訓練框架與新型架構設計,在保持低資源占用的同時實現了性能突破,可滿足從移動端到服務器端的多樣化部署需求。
針對不同應用場景,四款模型呈現差異化特性。0.8B與2B版本以極致輕量化為核心,模型體積較同類產品縮減40%以上,推理速度提升2-3倍,特別適用于智能手表、車載終端等資源受限設備,以及需要毫秒級響應的實時交互場景。經實測,2B模型在ARM架構設備上的功耗可控制在1.5W以內,為邊緣計算設備提供高效解決方案。
4B版本定位為智能體開發基座,集成多模態理解能力與強化學習框架,在復雜任務分解、工具調用等Agent核心能力測試中,性能較前代提升65%。該模型在保持4GB顯存占用的同時,支持同時處理文本、圖像、語音等多類型輸入,成為開發輕量化數字助手的理想選擇。
9B版本展現驚人性能密度,在數學推理、代碼生成等12項基準測試中達到GPT-oss-120B模型的92%性能水平,而參數量僅為后者的7.5%。其獨特的動態稀疏激活技術,使模型在16GB顯存服務器上可實現每秒32 token的生成速度,特別適合中小企業搭建高性價比的AI服務平臺。
此次開源同步開放了基座模型訓練代碼與數據預處理工具鏈,開發者可基于魔搭社區與Hugging Face平臺獲取完整資源。隨著四款小尺寸模型的加入,Qwen3.5家族已形成覆蓋0.8B至397B參數的完整矩陣,包含1個超大模型、3個中型模型及4個小尺寸模型,為不同量級的AI應用提供從原型開發到規模部署的全鏈路支持。









