北京智源人工智能研究院近日宣布完成一項重要技術驗證:基于六款AI芯片、三大模型以及同構與異構千卡架構的眾智FlagOS系統,成功實現AI訓練全要素技術棧的統一驗證。作為核心參與方,摩爾線程憑借其旗艦級AI訓推一體全功能GPU智算卡MTT S5000,全面適配了FlagOS訓練生態中的關鍵組件,包括系統調度框架FlagScale、分布式訓練框架Megatron-LM、加速庫Transformer Engine,以及算子庫FlagGems與Triton、通信庫FlagCX等核心模塊。
在針對Qwen3-0.6B語言模型的實測中,MTT S5000完成了1T Tokens規模的從頭訓練任務,持續運行6天以上、超過14000步未出現中斷。訓練結果顯示,模型Loss曲線與基準模型高度吻合,平均相對誤差控制在0.82%以內。更引人注目的是,在標準下游任務評測中,該模型性能較行業標桿產品(英偉達方案)提升1.65個百分點,充分驗證了國產全功能GPU在大規模模型端到端訓練中的可靠性與效率優勢。
智源研究院副院長兼總工程師林詠華指出,行業長期將"對齊CUDA"作為技術標準,本質上是缺乏替代方案的妥協之舉。她強調:"真正推動產業進步的關鍵,在于實現超越現有框架的實際訓練效果。摩爾線程此次在實測中展現出的性能優勢,證明通過自主技術路線突破國際主流產品壟斷已具備可行性,這將為AI基礎設施架構創新開辟新路徑。"據透露,此次驗證成果標志著國產AI硬件生態在兼容性、穩定性和效率三個維度均達到國際先進水平。











