在近日舉辦的英偉達GTC大會上,創始人兼CEO黃仁勛以一場長達兩小時的主題演講,將“Token”這一概念推向了行業焦點。幾乎在同一時間,阿里巴巴宣布成立Token事業群,明確提出“創造、輸送、應用”的完整鏈路。兩大科技巨頭的同步動作,標志著AI產業正從模型競賽轉向以Token為核心的生產力競爭。
Token作為大模型處理文本的基本單元,其重要性正在重塑AI產業鏈的度量標準。傳統上,底層模型團隊關注參數規模,應用層聚焦用戶增長,云服務則緊盯算力利用率。但隨著AI從感知、生成向推理階段演進,Token與收入的關聯愈發緊密——企業獲取的算力越多,生成的Token量越大,收入隨之增長,進而反哺模型智能化升級。這種正向循環,讓英偉達成為最大受益者。
黃仁勛在演講中直言,推理計算量在過去兩年增長萬倍,使用量激增百倍,AI正從“能感知”邁向“能工作”。基于此,他提出英偉達的全新戰略:從數據中心轉型為“Token工廠”。按照規劃,未來每家AI公司都應以Token生產效率為核心指標,甚至Token本身將成為按吞吐量和交互速度定價的“大宗商品”。英偉達為此設計了分層定價體系:免費層以廣告變現,中級層每百萬Token收費3-6美元,高速層則高達45-150美元。黃仁勛強調,新架構將使免費層吞吐量極致提升,同時在高價值推理層級實現35倍效率飛躍。
為支撐這一目標,英偉達推出了專為智能體推理設計的Vera Rubin計算系統。該系統整合7款新芯片、5個機架和1臺超級計算機,其中72塊GPU通過NVLink高速互聯,確保前填充計算與Token響應速度的平衡;全球首款采用LPDDR5內存的數據中心CPU——Vera CPU,則負責處理重復邏輯操作,解放GPU算力;BlueField 4+CX9存儲平臺與CPO Spectrum-X交換機,分別優化數據流處理與網絡傳輸效率。整套系統采用液冷方案,安裝時間從兩天縮短至兩小時,預計2026年下半年出貨。據測試,其推理速度較上一代提升5倍,Token成本降低10倍,MoE模型所需GPU減少至四分之一。
面對異構計算融合的挑戰,英偉達將收購的Groq LPU平臺納入體系,并開發操作系統Dynamo協調任務分配。黃仁勛建議,高吞吐負載可全量使用Vera Rubin,而代碼生成等高價值場景可引入25%的Groq芯片。這種設計使數據中心在單位功耗下性能提升35倍,同時兼顧低延遲與高價值推理服務。英偉達還預告了2028年推出的Vera Rubin Ultra及Feynman架構,將3D堆疊、LPU集成、異構存儲等技術列為未來核心。
黃仁勛的演講還涉及當前熱門的OpenClaw項目。他認為,這一智能體操作系統將重塑企業IT,推動SaaS公司向AaaS轉型,使2萬億美元的產業規模擴展至數萬億美元。為應對安全風險,英偉達與開發者合作推出企業版NeMo Claw,通過“網絡護欄”和“隱私路由”等技術保障數據安全。黃仁勛甚至預言,Token可能成為硅谷工程師年薪的一部分,“入職配額”或成招聘新趨勢。
在圖形計算領域,英偉達發布了被黃仁勛稱為“圖形學GPT時刻”的DLSS 5技術。該技術融合3D圖形、結構化數據與生成式AI,通過確定性框架與概率計算的結合,實現內容的美觀、精確與可控。為解決非結構化數據占比超九成的難題,英偉達同步推出cuDF和cuVS工具,分別處理結構化與非結構化數據,目前已被IBM、戴爾等企業整合進云服務體系。
從底層芯片到操作系統,從異構架構到數據工具,英偉達正構建覆蓋Token生產全鏈條的“生產力套件”。這場轉型不僅關乎技術路線,更預示著AI競爭規則的重寫——當模型性能趨于同質化,誰能主導Token生產,誰就能掌握下一代AI產業的主導權。











