在大型云端服務供應商(CSP)加速自研芯片布局的背景下,英偉達正調整其AI市場戰略重心。據TrendForce集邦咨詢最新研究顯示,該公司將在GTC 2026大會上重點展示AI推理應用的實際落地案例,這與過去聚焦云端AI訓練市場的策略形成鮮明對比。通過構建GPU、CPU與LPU的多元產品矩陣,英偉達試圖同時滿足AI訓練與推理的差異化需求,并依托機柜級整合方案推動供應鏈協同發展。
隨著谷歌、亞馬遜等科技巨頭自研芯片的滲透率持續提升,專用集成電路(ASIC)在AI服務器市場的占比預計將從2026年的27.8%躍升至2030年的近40%。這一趨勢迫使英偉達加速技術迭代,其最新推出的Vera Rubin系統被定義為高度垂直整合的解決方案,包含七款定制芯片與五款機柜設計,旨在通過軟硬件深度協同提升計算效率。
在產品部署節奏方面,英偉達計劃于2026年第二季度開始為Rubin GPU搭載HBM4高帶寬存儲器,第三季度實現相關芯片的批量出貨。其GB300整柜式系統自2025年第四季度取代前代產品成為主力機型后,預計2026年出貨量占比將突破80%;而VR200機柜系統則需待2026年第三季度末完成ODM廠商驗證后,才能逐步釋放產能。
針對AI代理模型時代面臨的延遲與存儲瓶頸,英偉達通過整合Groq團隊技術推出Groq 3 LPU推理專用芯片。該產品單顆集成500MB靜態隨機存取存儲器(SRAM),整機柜容量可達128GB,但受限于存儲規模仍無法承載Vera Rubin級別的模型參數。為此,英偉達創新性地提出"解耦合推理"架構,通過Dynamo作業系統將推理流程拆分為兩個階段:數學運算密集的預填充(Pre-fill)與注意力(Attention)計算交由Vera Rubin執行,而對帶寬敏感的譯碼與令牌生成環節則轉移至配備擴展存儲的LPU機柜。
供應鏈動態顯示,三星代工的第三代Groq LP30芯片已進入全產能生產階段,預計2026年下半年開始交付。英偉達還透露,基于Feynman架構的下一代LP40芯片正在研發中,其性能指標較現有產品將有顯著提升,這表明公司在低延遲推理領域的布局仍在持續深化。








