在人工智能從“基礎模型構建”向“規模化應用落地”轉型的關鍵節點,云天勵飛近日舉辦“大算力芯片戰略前瞻會”,正式公布未來三年大算力AI推理芯片的戰略布局。公司宣布將集中核心研發資源突破大模型落地的“成本壁壘”,通過底層架構創新實現百萬Tokens推理成本降低超100倍的目標,推動AI技術從實驗室走向普惠化生產場景。
全球算力產業重心正加速向推理側傾斜。谷歌2025年4月發布的第七代TPU“Ironwood”明確定位為“推理時代基石”,重點優化大規模推理能效;英偉達同年12月斥資200億美元與推理芯片廠商Groq達成非獨占許可協議,吸納其核心團隊強化實時工作負載能力。行業信號顯示,推理競爭已從“參數規模”轉向“單位成本與交付效率”,能效比成為規模化落地的核心門檻。
云天勵飛提出GPNPU技術路線,以“GPNPU = GPGPU + NPU + 3D堆疊存儲”公式重構芯片架構。該路線通過兼容CUDA生態實現一行代碼遷移,降低企業應用門檻;采用NPU專用化設計提升能效比,針對大模型推理的結構化負載優化成本;研發3D堆疊存儲技術突破“內存墻”瓶頸,降低推理時延。公司CTO李愛軍強調,架構創新需兼顧通用性與專用性,在工程層面解決可遷移、可部署、可持續降本三大難題。
在產品化路徑上,云天勵飛推出“算力積木”架構,通過Chiplet技術實現算力模塊化擴展,支持從邊緣設備到千卡集群的彈性部署。公司拒絕單純堆砌芯片參數,轉而圍繞真實業務負載進行系統級優化,逐項擊穿推理鏈路中的成本與時延瓶頸。目前,其政企事業部已啟動區域級“千卡集群”建設,旨在樹立城市AI算力賦能標桿。
支撐戰略落地的核心在于五大要素協同:技術層面,公司聚焦AI大算力推理芯片研發;產能層面,其國產供應鏈儲備為大規模量產提供確定性;生態層面,四大事業部覆蓋研發、優化到推廣的全鏈條;市場層面,政企事業部主導推理設備與智算中心建設;資本層面,市值突破萬億元的愿景彰顯長期信心。董事長陳寧特別指出,供應鏈安全是當前行業競爭的關鍵變量,云天勵飛已構建起抵御外部風險的護城河。
根據規劃,云天勵飛未來三年將梯度推進DeepVerse芯片研發,對標國際主流平臺優化長上下文預填充、低時延解碼等關鍵環節。2028年產品將采用PD分離、AFN分離及超節點架構設計,性能指標有望比肩英偉達Rubin架構。公司強調,推理時代的競爭本質是“單位推理成本”之爭,唯有將技術做得足夠便宜、穩定、易用,才能推動AI從“能力展示”轉向“生產力工具”。











