在華為中國合作伙伴大會上,一款名為Atlas 350的AI訓練推理加速卡正式亮相并宣布上市。這款加速卡搭載了華為最新推出的昇騰950PR處理器,憑借其強大的性能,迅速成為全場焦點。
昇騰950PR芯片于今年早些時候發布,采用SIMD架構,算力驚人。在FP8數據格式下,其算力可達1PFLOPS,而在FP4格式下更是高達2PFLOPS。該芯片支持多種數據格式,包括FP32、HF32、FP16等,互聯帶寬達到2TB/s,內存容量和帶寬也分別達到了128GB和1.6TB/s。與前一代產品相比,昇騰950PR在低精度數據格式處理、向量算力、互聯帶寬以及自研HBM等方面均實現了顯著提升。
與英偉達的H20芯片相比,昇騰950PR在HBM容量上更勝一籌,達到了112GB,是H20的1.16倍。同時,其多模態生成速度提升了60%,內存訪問顆粒度從512字節減少到128字節,使得小算子的訪存效率提升了4倍。這些優勢使得Atlas 350加速卡在性能上有了質的飛躍。
Atlas 350加速卡的硬件參數同樣令人矚目。在FP4精度下,其算力高達1.56P,帶寬達到了1.4TB/s。盡管功耗為600W,是H20的1.5倍,但考慮到其卓越的性能,這一功耗水平仍在可接受范圍內。
華為昇騰計算業務總裁張迪煊表示,Atlas 350的單卡算力是英偉達H20的2.87倍,是目前國內唯一支持FP4低精度的推理產品。這意味著,搭載Atlas 350的服務器能夠支持更大規模的模型,實現更低的推理時延,從而提高計算速度和寄存器效率。
在實際應用中,Atlas 350加速卡已經展現出了強大的實力。在互聯網推薦場景的實測中,該卡時延更低、響應更快,特別適合短視頻、電商、廣告推薦等高并發場景。同時,在大模型推理、文生圖、文生視頻等多模態場景中,其性能也與英偉達的L20相當。
基于Atlas 350等產品,華為昇騰還計劃打造大、中、小三大核心算力場景,以滿足不同客戶的差異化需求。在此次大會上,昆侖、華鯤振宇等7家華為核心伙伴發布了基于Atlas 350的服務器整機產品,標志著昇騰950代際推理算力正式進入商用階段。
其中,軟通動力旗下的軟通華方發布的“超強A860 A5”服務器備受關注。這款6U2路AI服務器產品搭載了鯤鵬920新型號處理器,可支持8塊昇騰Atlas350加速卡,具有超強算力、靈活拓展和安全可靠等特點,適用于AI大語言模型訓練和推理、AI加速計算、視頻分析等多種應用場景。
科大訊飛也宣布將新一代星火大模型與昇騰910/950系列算力底座進行充分適配,為用戶提供更加智能、高效的AI解決方案。華為昇騰還聯合20家行業頭部伙伴發布了2026昇騰AI應用場景解決方案,覆蓋輔助辦公、AI實訓、電子病歷等多個行業核心場景。
值得一提的是,近期基于OpenClaw的“養蝦”熱潮激發了相關AI一體機的需求。華為透露,過去一個多月已有十幾家合作伙伴推出了基于昇騰的OpenClaw一體機。截至目前,昇騰已聯合伙伴打造了400多款行業一體機,服務客戶超過2700家,占據國內一體機市場80%以上的份額。








