中科曙光(603019.SH)近日宣布,在國產高端網絡技術領域取得里程碑式進展,成功推出國內首款全棧自研的400G無損高速網絡解決方案——scaleFabric。該產品以原生RDMA架構為核心,實現了從底層112G SerDes高速信號傳輸技術、硬件設備到上層管理軟件的完全自主化研發,標志著我國在數據中心高速網絡領域首次打破國際技術壟斷,為超大規模人工智能計算集群提供了關鍵基礎設施支撐。
作為面向下一代智算場景設計的創新產品,scaleFabric構建了完整的自主技術生態鏈。其研發團隊攻克了核心IP設計、交換芯片架構、智能網卡開發等關鍵技術難題,形成涵蓋網卡、交換機、驅動軟件及集群管理系統的全鏈條解決方案。這種從硬件到軟件的垂直整合能力,使系統性能優化不再受制于國外技術標準,為國內AI企業構建自主可控的計算網絡提供了全新選擇。
在性能指標方面,scaleFabric400系列展現出強勁的競爭力。其智能網卡采用PCIe5.0高速接口,單端口帶寬突破400Gbps,端到端通信延遲控制在0.9微秒以內;配套交換機產品單端口帶寬達800Gbps,整機交換容量高達雙向64Tbps,交換延遲僅260納秒。經實測驗證,該網絡架構可完美支撐萬卡級AI訓練集群的并發計算需求,在帶寬利用率和時延穩定性等關鍵指標上達到國際領先水平。
針對大規模集群運行的穩定性挑戰,研發團隊創新性地采用信用制無損流量控制機制,從協議層面消除網絡擁塞導致的丟包風險。測試數據顯示,系統可在1毫秒內完成鏈路故障自動恢復,近萬卡規模集群已持續穩定運行超過10個月。相比國際同類產品,scaleFabric的交換機端口密度提升25%,網卡并發連接數增加100%,單子網互連規模擴展至傳統IB網絡的2.33倍,最大可支持11.4萬卡規模的超大型集群部署。
成本優勢成為該產品的另一大亮點。通過架構優化和自主技術替代,scaleFabric在保持性能領先的同時,將網絡建設總成本降低30%。這種"性能不減、成本更優"的特性,特別適用于需要大規模擴展計算資源的AI訓練場景,為國內企業構建自主可控的智算基礎設施提供了更具性價比的解決方案。目前,該產品已進入多家頭部AI企業的測試驗證階段,預計將在年內實現規模化商用部署。











