春節期間,國產AI大模型領域迎來新一輪競爭熱潮,多款熱門模型相繼亮相,其中智譜推出的GLM-5憑借技術突破成為焦點。這款模型參數量達7440億,較前代GLM-4.X擴大近一倍,在編程與智能體能力方面實現顯著提升。海外AI博主測試數據顯示,其代理編程能力位居全球首位,綜合編程能力位列第三,超越Opus 4.5并緊追Opus 4.6與Gemini 3 Pro。
模型發布后因用戶需求激增,一度出現算力資源緊張的情況,導致部分用戶體驗波動。智譜官方為此發布致歉聲明,并推出補償方案。這一現象側面印證了市場對GLM-5技術實力的認可,也反映出國產大模型在商業化落地過程中面臨的挑戰。
技術層面,GLM-5通過四大創新實現性能躍升。首先引入的DSA稀疏注意力機制,通過動態分配注意力資源,在保持長文本理解能力的同時,將訓練與推理成本降低至行業領先水平。該機制支持模型參數擴展至7440億規模,訓練數據量達28.5萬億Token,為復雜任務處理奠定基礎。
在強化學習架構方面,研發團隊構建了異步RL基礎設施,實現生成與訓練環節的深度解耦。基于前代slime框架的優化,新系統將GPU利用率提升至新高度,支持大規模智能體軌跡探索,有效解決了傳統同步模式導致的迭代效率瓶頸問題。
針對智能體決策質量提升,團隊提出異步Agent RL算法。該算法突破傳統迭代自蒸餾模式,使模型能夠從長周期交互中持續學習,特別優化了動態環境下的規劃與糾錯能力。這項突破成為GLM-5在真實編程場景中表現優異的核心支撐。
國產化適配方面,GLM-5完成從底層內核到推理框架的全鏈條優化,全面兼容華為昇騰、摩爾線程、海光等七大國產芯片平臺。實測數據顯示,單臺國產算力節點的性能已可對標雙國際主流GPU集群,長序列處理場景的部署成本降低50%,為國產AI生態建設提供重要實踐案例。








