摩爾線程近日宣布,其旗艦級AI訓推一體全功能GPU MTT S5000已成功完成對智譜新一代大模型GLM-5的全流程適配與驗證。這一成果基于SGLang推理框架實現,標志著國產GPU在高性能AI計算領域取得重要突破。
MTT S5000作為專為大模型訓練與推理設計的智算卡,采用第四代MUSA架構"平湖",單卡AI算力最高可達1000 TFLOPS,配備80GB顯存及1.6TB/s顯存帶寬。該設備完整支持從FP8到FP64的全精度計算,卡間互聯帶寬達784GB/s,為GLM-5的部署提供了堅實的硬件基礎。
通過MUSA架構的廣泛算子覆蓋與生態兼容能力,摩爾線程團隊成功打通了模型推理全鏈路。特別值得注意的是,MTT S5000的原生FP8加速能力得到深度釋放,在保持模型精度的前提下,顯存占用顯著降低,為GLM-5的高性能推理提供了關鍵技術支撐。
作為GLM系列的最新成果,GLM-5定位為頂尖Coding模型,其整體性能較前代提升20%。該模型的核心優勢在于Agentic Engineering能力,不僅具備深厚的代碼生成功底,更能處理復雜系統工程和長程Agent任務,實現從需求分析到應用部署的端到端開發流程。
此次適配驗證表明,MTT S5000可充分滿足大模型推理的嚴苛要求。其硬件架構與GLM-5的軟件特性形成完美配合,為金融、科研、智能制造等領域的高性能AI應用提供了新的解決方案。隨著國產GPU生態的持續完善,此類技術突破將推動AI計算向更高效、更經濟的方向發展。











