在2026年GTC大會上,英偉達正式推出Vera Rubin AI平臺,旨在加速智能體AI(Agentic AI)的技術演進。這一平臺被公司創始人兼首席執行官黃仁勛稱為“代際飛躍”,標志著其歷史上最大規模AI基礎設施建設的啟動,覆蓋從大規模預訓練到實時推理的完整AI生命周期。
在算力架構方面,新一代NVL72機架通過NVLink 6技術將72塊Rubin GPU與36塊Vera CPU深度整合,實現了計算效率的突破性提升。相較于前代Blackwell平臺,該系統在混合專家大模型(MoE)訓練中僅需四分之一的GPU資源,同時將每瓦推理吞吐量提高10倍,單Token處理成本降低至十分之一。
針對AI模型驗證環節,英偉達設計了專用Vera CPU機架,集成256塊液冷CPU。該架構通過優化散熱設計,使運行效率達到傳統CPU的兩倍,數據處理速度提升50%,為大規模模型驗證提供了高效支撐。
為滿足智能體系統對低延遲和長上下文的需求,英偉達同步推出Groq 3 LPX推理加速機架。該系統配備256個LPU處理器,與Vera Rubin平臺協同工作時,每兆瓦推理吞吐量最高可提升35倍,顯著優化了實時交互場景的性能表現。
在數據存儲領域,全新BlueField-4 STX機架構建了AI原生存儲架構。基于DOCA Memos框架,該系統可高效處理大型語言模型生成的海量鍵值(KV)緩存數據,在降低能耗的同時將推理吞吐量提升最高5倍,為多輪AI對話等復雜場景提供更快的響應能力。











