3月2日消息,今年的春節檔有多個國產AI大模型發布,但DeepSeek V4并沒有如預期的那樣問世,好消息是下周很有可能就正式發布了。
這個消息最初是英國FT金融時報報道的,援引的是消息人士,雖然不知道這些消息人士是否內部人員,但考慮到下周有全年最重磅的會議兩會開幕,而且還是十五五計劃開局,因此DeepSeek V4下周問世的消息還是很可信的。
去年春節檔發布的DeepSeek R1給美國AI行業幾大的震撼,當時NVIDIA的股價暴跌17%,雖然不全是DeepSeek的因素,但美國因此患上了DeepSeek恐懼癥,生怕每次國產的開源AI發布就給美國AI一波沖擊。
DeepSeek V4這次會帶來哪些沖擊?現在誰也不好說,美國CNBC做了個長達40分鐘的視頻內容——China next AI shock is hardware,中國下一次AI沖擊是硬件,指出了DeepSeek V4發布之后將會沖擊美國硬件行業。
實際上這也不是什么新聞了,DeepSeek之前的大模型還用了NVIDIA的AI卡訓練,DeepSeek V4這一代顯然會加大對國產AI芯片的支持,在國產芯片上完成訓練、推理,并為多個國產AI芯片優化,目前可知的是華為昇騰及寒武紀的思元系列會有。
去年DeepSeek V3.1發布時,DeepSeek官方明確提到UE8M0 FP8是即將發布的下一代國產芯片設計。
之前國產AI芯片普遍就支持到FP16格式,部分AI可以軟件支持到FP8,但顯然不如原生FP8,后者相比FP16理論性能翻倍,對帶寬的要求也大幅降低,有助于降低成本,畢竟之前傳聞V4的成本只有對手的1/50。
國產AI芯片中目前最強的還是華為的昇騰系統,尤其是去年華為推出了超節點集群,路線圖公布了昇騰Atlas 950 SuperPoD、Atlas 960 SuperPoD及Atlas 970 SuperPoD,今年問世的是Atlas 950系列。
Atlas 950超節點支持8192張基于Ascend 950DT的昇騰卡,是Atlas 900超節點的20多倍,
滿配包括由128個計算柜、32個互聯柜,共計160個機柜組成,占地面積1000平方米左右,柜間采用全光互聯。
總算力大幅度提升,其中FP8算力達到8E FLOPS,FP4算力達到16E FLOPS,互聯帶寬達到16PB/s,這個數字意味著Atlas 950一個產品的總互聯帶寬,已經超過今天全球互聯網峰值帶寬的10倍有余。
對比NVIDIA今年下半年發布的NVL144,Atlas 950超節點卡的規模是其56.8倍,總算力是其6.7倍,內存容量是其15倍,達到1152TB;互聯帶寬是其62倍,達到16.3PB/s。
即使是與NVIDIA計劃2027年上市的 NVL576相比,Atlas 950超節點在各方面依然是領先的。











