北京智源人工智能研究院近日宣布完成一項重要技術驗證,通過統一技術棧實現了AI訓練全要素的協同運行。此次驗證覆蓋六款AI芯片、三大模型架構以及同構與異構千卡集群,依托自主研發的眾智FlagOS系統完成全流程測試,標志著我國在AI基礎設施領域取得關鍵突破。
作為核心參與方之一的摩爾線程,其旗艦級AI訓推一體GPU智算卡MTT S5000在此次測試中表現亮眼。該產品全面適配FlagOS訓練軟件棧,涵蓋系統調度框架、分布式訓練框架、加速計算庫及通信協議等五大核心組件,形成從硬件到軟件的完整技術閉環。測試數據顯示,MTT S5000在持續6天、超過14000步的訓練過程中保持零中斷記錄,展現出卓越的穩定性。
在針對Qwen3-0.6B語言模型的1T Tokens從頭訓練中,MTT S5000交出亮眼成績單:訓練損失曲線與基準模型高度吻合,平均相對誤差控制在0.82%以內;在標準下游任務評估中,關鍵指標較行業標桿提升1.65個百分點。這些數據充分驗證了國產全功能GPU在大規模模型訓練中的技術可行性,為AI算力國產化替代提供了重要實踐依據。
此次驗證采用異構計算架構,通過FlagOS系統調度決策框架實現不同芯片間的協同工作。測試集群包含多種類型AI加速器,在統一軟件棧支持下完成千卡級并行訓練,這種技術路線為構建多元化AI算力生態提供了新思路。摩爾線程技術團隊表示,將持續優化硬件性能與軟件適配,推動國產AI基礎設施向更高效率發展。











