岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

曦望啟望S3推理GPU亮相:聚焦單位Token成本,國產GPU開啟新征程

   時間:2026-01-28 04:35:39 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

國產GPU廠商曦望(Sunrise)在杭州舉辦的首屆Sunrise GPU Summit上,發布了新一代推理GPU芯片啟望S3,并同步推出面向大模型推理的超節點方案及推理云計劃。這一動作標志著曦望在完成近一年約30億元戰略融資后,首次系統性展示其技術路線與產品布局,為國產GPU產業從“參數競爭”轉向“成本競爭”提供了新范式。

與傳統GPU廠商聚焦“訓推一體”不同,曦望選擇了一條差異化路徑:啟望S3不追求峰值訓練性能,而是將全部資源投入推理效率與單位成本優化。曦望聯席CEO王勇在發布會上指出,大模型產業正從訓練主導轉向推理主導,GPU的商業價值將取決于單位Token的真實成本,而非參數指標。這一判斷直接影響了芯片設計邏輯——啟望S3圍繞真實推理負載,對算力結構、存儲體系和互聯方式進行系統性重構。

在算力設計上,啟望S3支持從FP16到FP4的多精度靈活切換,通過低精度推理效率最大化釋放算力潛力,精準匹配MoE(混合專家模型)和長上下文模型在推理階段的實際需求。存儲方面,該芯片采用LPDDR6顯存方案,成為國內首款搭載該技術的GPU,顯存容量較上一代提升4倍,有效緩解了大模型推理中的顯存駐留與訪存瓶頸。官方數據顯示,在DeepSeek V3/R1等主流模型推理場景中,啟望S3的單位Token成本較上一代下降約90%,且這一指標已通過工程驗證,具備可復現性。

針對千億、萬億級參數多模態MoE模型的部署需求,曦望同步推出寰望SC3超節點解決方案。該方案支持單域256卡一級互聯,可高效支撐PD分離架構與大EP(Expert Parallelism)規?;渴穑到y利用率與穩定性顯著提升,適配長上下文、多并發、多專家并行等復雜推理場景。在交付形態上,寰望SC3采用全液冷設計,PUE(電源使用效率)表現極致,并支持模塊化部署,將整體系統交付成本從行業常見的億元級降至千萬元級,降幅達一個數量級。

軟件生態層面,曦望構建了與CUDA兼容的基礎軟件體系,覆蓋驅動、運行時API、開發工具鏈、算子庫和通信庫,降低推理應用遷移門檻。目前,該體系已適配ModelScope平臺90%以上主流大模型,包括DeepSeek、通義千問等,為開發者提供無縫切換的兼容性支持。

曦望的野心不止于芯片本身。通過與商湯科技、第四范式等生態伙伴合作,曦望探索推理云平臺,試圖解決“推理算力如何更好用”的問題。該平臺通過GPU池化與彈性調度,將底層算力整合為統一推理池,并以MaaS(Model as a Service)模式向企業開放,用戶無需關注硬件配置與集群運維,即可按需調用大模型推理能力。這一體系成為曦望“百萬Token一分錢”推理成本合作的技術基礎。

曦望董事長徐冰在會上強調,推理時代的核心是持續、穩定地將算力轉化為可交付的生產力,而非單純銷售芯片。數據顯示,2025年曦望推理GPU芯片交付量已突破1萬片,標志著其路線從工程驗證邁向規?;涞?。中國工程院院士吳漢明指出,推理算力的價值實現需要芯片設計、系統集成、軟件開發到產業應用的全鏈條協作,曦望的實踐為國產GPU產業提供了重要參考。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 色在线观看视频 | 久久精品99国产精品日本 | 久久国产精品久久精品国产 | 日韩成人免费视频 | 98视频在线 | 日日干夜夜艹 | 在线日韩 | 国产精品自产拍在线观看 | 国产成人+综合亚洲+天堂 | 免费精品一区二区 | www.亚洲天堂 | 日韩毛片在线看 | 伊人春色在线观看 | 亚洲欧美一区二区三区在线 | 欧美激情在线播放 | 亚洲妇女毛茸茸 | 国产视频97 | 日韩国产在线观看 | 亚洲天天综合 | 成人毛片网站 | 欧美成人精品一区二区三区在线看 | 国产在线观看免费网站 | av导航在线 | 欧美黄色免费在线观看 | 成人午夜影院在线观看 | 欧美在线网 | 欧美 日本 国产 | 韩国黄色录像 | 国内三级视频 | 国产精品99久久久久久久久 | 成人激情av | 一二三区精品 | 久草婷婷 | 久久久久久久久久久网站 | 一级黄色在线观看 | 女人的天堂av在线 | 小说av| 一级片一级片一级片 | av在线一 | 在线观看av中文字幕 | 香蕉网在线 |