在英偉達GTC 2026主題演講中,創始人黃仁勛將2025年定義為"推理之年",并指出AI技術已從訓練階段全面轉向推理應用。他以近期爆紅的開源項目OpenClaw為例,稱其僅用數周時間便達到Linux三十年積累的影響力,強調企業必須制定明確的OpenClaw戰略。基于該項目的衍生產品NemoClaw同步發布,通過強化隱私安全控制,用戶可通過單一指令完成部署。
黃仁勛透露,隨著個人AI代理工具的普及,推理需求呈現指數級增長。2025年GPU市場持續供不應求,盡管英偉達保持大規模出貨,但需求增速遠超預期。這主要源于推理階段對算力需求的激增——相較于訓練階段,推理所需的Token量和算力規模提升了約10000倍。OpenAI、Anthropic等企業通過算力-收入-用戶的正向循環,推動AI系統持續進化。
面對AMD等競爭對手及客戶自研芯片的挑戰,英偉達在GTC大會上推出全球首款智能代理專用處理器Vera CPU。該產品效率較傳統機架級CPU提升一倍,速度提高50%,標志著英偉達首次將CPU作為獨立產品推向市場。根據與meta的協議,Grace CPU將于2027年在其數據中心大規模部署,而Vera CPU的商業化進程已正式啟動。
在異構計算領域,英偉達整合了Groq 3 LPX推理加速器,與Vera Rubin平臺形成低延遲、大上下文處理的解決方案。這種組合既能滿足AI工廠級算力需求,也可支持智能代理系統的高速token生成。去年12月收購Groq團隊后,其芯片已進入量產階段,預計今年第三季度由三星代工出貨,這標志著英偉達在推理加速領域的技術整合取得實質性進展。
產品路線圖顯示,英偉達將維持"一年一代架構"的迭代速度。繼2027年推出Rubin Ultra后,2028年計劃發布Feynman架構平臺,但具體技術細節尚未披露。財務預測方面,公司預計到2027年AI芯片收入將突破1萬億美元,較2月財報中2026年5000億美元的預測大幅上調。盡管年初股價累計下跌約3%,但主題演講當日收漲1.63%,市值維持在4.45萬億美元高位,繼續領跑全球上市公司。
在生態建設層面,英偉達通過非獨家授權協議吸納Groq推理技術,并整合至現有產品線。這種開放合作策略與自主研發形成互補,既強化了技術壁壘,也拓展了應用場景。隨著Vera CPU和Groq 3 LPX的組合方案落地,英偉達正構建覆蓋訓練到推理的全棧AI計算平臺,試圖在多元化競爭格局中鞏固領先地位。











