2 月 12 日消息,2 月 11 日,智譜正式發布新一代大模型 GLM-5。摩爾線程基于 SGLang 推理框架,在旗艦級 AI 訓推一體全功能 GPU MTT S5000 上,Day-0 完成了全流程適配與驗證。
據介紹,憑借 MUSA 架構廣泛的算子覆蓋與強大的生態兼容能力,摩爾線程成功打通了模型推理全鏈路,并深度釋放 MTT S5000 的原生 FP8 加速能力,在確保模型精度的同時顯著降低了顯存占用,實現了 GLM-5 的高性能推理。
作為 GLM 系列的最新里程碑版本,GLM-5 定位為當下頂尖的 Coding 模型,整體性能較上一代提升 20%。其核心突破在于 Agentic Engineering(代理工程)能力 —— 不僅具備深厚的代碼功底,更擁有處理復雜系統工程與長程 Agent 任務的實力,能夠實現從需求到應用的端到端開發。
MTT S5000 是專為大模型訓練、推理及高性能計算而設計的全功能 GPU 智算卡,基于第四代 MUSA 架構“平湖”打造。其單卡 AI 算力最高可達 1000 TFLOPS,配備 80GB 顯存,顯存帶寬達到 1.6TB/s,卡間互聯帶寬為 784GB/s,完整支持從 FP8 到 FP64 的全精度計算。











