國產(chǎn)GPU企業(yè)摩爾線程近日宣布,在8位浮點(FP8)計算技術(shù)領(lǐng)域?qū)崿F(xiàn)重大突破,構(gòu)建了覆蓋芯片設(shè)計、硬件實現(xiàn)到應(yīng)用部署的全棧技術(shù)體系。據(jù)介紹,該公司成為國內(nèi)少數(shù)具備完整FP8技術(shù)能力的GPU廠商之一,其技術(shù)路線與全球領(lǐng)先企業(yè)保持同步,為人工智能算力優(yōu)化提供了新路徑。
FP8技術(shù)的核心優(yōu)勢在于平衡計算效率與模型精度。摩爾線程技術(shù)團(tuán)隊指出,該技術(shù)通過降低數(shù)據(jù)位寬顯著提升算力密度,同時采用創(chuàng)新算法保持推理精度損失在可控范圍內(nèi)。這項突破不僅適用于大語言模型訓(xùn)練與推理場景,還可擴(kuò)展至圖形渲染、科學(xué)計算等傳統(tǒng)高性能計算領(lǐng)域,為多場景算力需求提供新的性能基準(zhǔn)。
硬件層面,基于第四代"平湖"架構(gòu)的旗艦產(chǎn)品MTT S5000 GPU已實現(xiàn)原生FP8計算支持。該芯片單卡稠密算力達(dá)1000TFLOPS,配備80GB顯存和1.6TB/s帶寬,卡間互聯(lián)帶寬784GB/s,支持從FP8到FP64的全精度計算。這種設(shè)計使其在保持低功耗的同時,能夠滿足不同精度要求的復(fù)雜計算任務(wù)。
軟件生態(tài)建設(shè)方面,摩爾線程通過MUSA AI計算平臺構(gòu)建了完整開發(fā)環(huán)境。該平臺已實現(xiàn)對PyTorch、Megatron-LM等主流框架的深度適配,支持vLLM、SGLang等新興工具鏈。特別開發(fā)的遷移工具可自動轉(zhuǎn)換現(xiàn)有模型,實現(xiàn)"零代碼修改"的生態(tài)兼容,幫助用戶將部署周期縮短60%以上,顯著降低算力平臺切換成本。
行業(yè)分析師認(rèn)為,隨著AI模型參數(shù)規(guī)模突破萬億級,算力需求呈現(xiàn)指數(shù)級增長。FP8等混合精度計算技術(shù)通過優(yōu)化數(shù)據(jù)表示方式,在保持模型性能的同時提升硬件利用率,已成為全球GPU廠商競爭的技術(shù)高地。摩爾線程的全棧技術(shù)布局,為其在AI訓(xùn)練、推理及高性能計算市場爭取到差異化競爭優(yōu)勢。









