英偉達(dá)GTC大會(huì)上,黃仁勛以“Token之王”的新身份亮相,盡管遲到15分鐘,但并未影響這場被業(yè)界視為AI領(lǐng)域年度盛典的關(guān)注度。450家企業(yè)贊助、1000場技術(shù)分會(huì)、2000位演講者、110臺(tái)機(jī)器人同臺(tái),規(guī)模遠(yuǎn)超傳統(tǒng)技術(shù)會(huì)議,更像一場全球AI從業(yè)者的“朝圣”。
黃仁勛的演講并未直接切入芯片發(fā)布,而是以25年技術(shù)演進(jìn)為脈絡(luò):從GeForce游戲顯卡到CUDA架構(gòu),從RTX渲染技術(shù)到云計(jì)算合作,最終落腳于當(dāng)下爆火的OpenClaw與token經(jīng)濟(jì)。他指出,AI從感知到生成、推理再到執(zhí)行,每一步都伴隨算力消耗的指數(shù)級(jí)增長,而英偉達(dá)的目標(biāo)是成為這一進(jìn)程的核心引擎。
“到2027年,英偉達(dá)營收將突破1萬億美元。”這一數(shù)字引發(fā)全場歡呼,較去年GTC上預(yù)測的5000億美元直接翻倍。黃仁勛強(qiáng)調(diào),這一預(yù)期基于Blackwell和Rubin架構(gòu)的訂單覆蓋,且實(shí)際需求可能更高。消息公布后,英偉達(dá)股價(jià)在現(xiàn)場掌聲中同步上揚(yáng)。
黃仁勛重點(diǎn)解讀了“Token工廠經(jīng)濟(jì)學(xué)”,通過一張縱軸為“每瓦Token吞吐量”、橫軸為“每秒Token速率”的圖表,構(gòu)建起完整的商業(yè)模型:免費(fèi)層以高吞吐獲客,中間層以3-6美元/百萬Token服務(wù)普通用戶,高級(jí)層定價(jià)45美元/百萬Token面向大模型深度推理,頂級(jí)層則以150美元/百萬Token承接超長研究任務(wù)。他直言:“全球CEO都該研究這張圖。”
性能對(duì)比數(shù)據(jù)成為另一焦點(diǎn)。Semi Analysis的基準(zhǔn)測試顯示,Grace Blackwell NVLink 72的每瓦token吞吐量較上一代Hopper H200提升50倍,而黃仁勛最初僅宣稱35倍。面對(duì)“故意保留余地”的質(zhì)疑,他坦然承認(rèn):“實(shí)際就是50倍。”這一數(shù)據(jù)背后,是數(shù)據(jù)中心功率的物理限制——在1GW功率下,每瓦性能直接決定token成本。
下一代計(jì)算平臺(tái)Vera Rubin的發(fā)布將氣氛推向高潮。這一系統(tǒng)集成7種芯片、5種機(jī)架,形成垂直優(yōu)化的巨型計(jì)算機(jī):Rubin GPU采用全新架構(gòu),支持NVLink 72全互聯(lián),算力達(dá)3.6 exaflops,帶寬260TB/s;Vera CPU作為全球首款采用LPDDR5的服務(wù)器處理器,單線程性能與能效比突出,甚至被黃仁勛調(diào)侃“原本沒打算單獨(dú)賣,結(jié)果成了數(shù)十億美元業(yè)務(wù)”;Groq LP30推理芯片則以500MB片上SRAM和確定性數(shù)據(jù)流架構(gòu),專為極速推理設(shè)計(jì)。
散熱與互聯(lián)的突破成為Vera Rubin的核心創(chuàng)新。液冷方案覆蓋全部組件,連NVLink交換機(jī)也浸入冷卻液,板級(jí)集成互聯(lián)取代傳統(tǒng)線纜,使機(jī)架安裝時(shí)間從兩天縮短至兩小時(shí);全球首款量產(chǎn)CPO(共封裝光學(xué))交換機(jī)Spectrum X則通過光學(xué)器件直接封裝到芯片上,消除電-光轉(zhuǎn)換延遲,支持72塊GPU實(shí)現(xiàn)260TB/s全對(duì)全帶寬。黃仁勛強(qiáng)調(diào):“銅纜與光學(xué)不是替代關(guān)系,未來都需要更多產(chǎn)能。”
針對(duì)高吞吐與低延遲的矛盾需求,英偉達(dá)提出“分離式推理”方案:Vera Rubin負(fù)責(zé)Pre-fill和attention計(jì)算,Groq承接decode階段的高帶寬需求。通過Dynamo推理框架拆分流水線,最高價(jià)值推理層吞吐量再提升35倍,并解鎖千token/秒的極速生成。黃仁勛建議,高吞吐工作負(fù)載可100%使用Vera Rubin,編程密集型任務(wù)則需分配25%數(shù)據(jù)中心功率給Groq。
發(fā)布會(huì)的尾聲,黃仁勛將話題轉(zhuǎn)向開源項(xiàng)目OpenClaw。他以“60歲父親用AI自動(dòng)化精釀啤酒生意”為例,闡釋其作為“Agent計(jì)算機(jī)操作系統(tǒng)”的定位:資源管理可調(diào)用大語言模型、訪問文件系統(tǒng);調(diào)度系統(tǒng)支持cron jobs與子Agent生成;I/O系統(tǒng)實(shí)現(xiàn)多模態(tài)交互。他類比道:“Windows定義PC時(shí)代,Linux定義服務(wù)器時(shí)代,OpenClaw將定義Agent時(shí)代。”
為應(yīng)對(duì)企業(yè)安全顧慮,英偉達(dá)同步推出企業(yè)版NeMo Claw,增加策略引擎、網(wǎng)絡(luò)護(hù)欄與隱私路由器。黃仁勛甚至預(yù)言:“未來工程師的招聘籌碼將包括年度token預(yù)算,這可能成為硅谷新標(biāo)準(zhǔn)。”
彩蛋環(huán)節(jié),黃仁勛預(yù)告了下一代計(jì)算架構(gòu)Feynman,其將整合全新GPU、LP40推理芯片與Rosa CPU,并通過Kyber技術(shù)實(shí)現(xiàn)銅線與光學(xué)的雙擴(kuò)展。更引人注目的是,英偉達(dá)正與合作伙伴開發(fā)太空數(shù)據(jù)中心計(jì)算機(jī)Space One,試圖在近地軌道解決輻射散熱難題,將AI算力推向“字面意義上的無處不在”。
直播回放鏈接:https://www.youtube.com/watch?v=jw_o0xr8MWU











