阿里云近日宣布推出全新千問旗艦推理模型Qwen3-Max-Thinking,該模型以超萬億級參數規模(1T)和36T Tokens的預訓練數據量,成為阿里迄今為止性能最強的推理模型。據介紹,這款模型通過參數規模、強化學習與計算能力的協同擴展,在多項國際基準測試中刷新了行業紀錄,標志著國產大模型在復雜推理領域取得重要突破。
技術層面,Qwen3-Max-Thinking創新采用測試時擴展(Test-time Scaling)機制,突破傳統推理模型依賴并行路徑重復計算的局限。該機制通過"經驗提取"技術對歷史推理結果進行智能提煉,支持多輪自我迭代優化,在保持相同上下文條件下實現更高效的計算資源利用。實驗數據顯示,這一創新使模型在處理復雜任務時的推理效率顯著提升,同時降低了計算成本。
在權威測試平臺"人類最后的測試"(HLE)中,該模型以58.3分的成績領先同類產品,較GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分形成明顯優勢。測試場景涵蓋工具調用、任務執行等復雜推理能力,充分驗證了模型在真實應用場景中的實用性。阿里云透露,模型特別強化了原生Agent能力,支持在對話過程中自主調用外部工具完成具體任務。
開發者和用戶可通過多渠道體驗新模型:QwenChat平臺已開放免費試用接口,企業客戶可通過阿里云百煉平臺獲取API服務,PC端和網頁端同步上線試用版本。千問APP即將完成模型接入更新,屆時所有用戶均可零門檻體驗這款頂級推理模型。這種多終端覆蓋的策略,體現了阿里推動AI技術普惠化的戰略布局。
項目負責人吳嘉在技術解讀中強調,真正的AI突破不應局限于對話交互。這位2010年加入阿里的浙江大學碩士畢業生指出:"優秀的AI系統需要具備自主行動能力,能夠理解任務需求、調用合適工具并交付完整結果。"作為阿里云資深技術專家轉任千問C端事業群總裁,吳嘉帶領團隊持續探索大模型的應用邊界,此次發布的成果正是其技術理念的集中體現。
據悉,Qwen3-Max-Thinking的研發團隊在模型架構設計階段就充分考慮了產業落地需求。通過優化推理計算路徑,模型在保持高性能的同時降低了硬件要求,為中小企業應用先進AI技術提供了可行方案。這種技術普惠性或將推動智能客服、自動化辦公、工業質檢等領域發生深刻變革。










