滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

從GPU到「Token工廠」，黃仁勛講了一個萬億美元的AI未來

時間：2026-03-17 15:19:51 來源：鞭牛士編輯：快訊 IP：北京 發表評論無障礙通道

當地時間3月16日，在年度開發者大會NVIDIA GTC 2026上，黃仁勛再次展示了英偉達對于人工智能產業未來的整體構想。

從新一代AI計算架構、推理時代的數據中心商業模式，到圍繞Agent構建的軟件生態和產業聯盟，本屆大會呈現的已經不僅是單一硬件產品的升級，而是一套圍繞算力展開的完整AI基礎設施體系。

在演講中，黃仁勛大膽給出了一個預測：到2027年，圍繞AI芯片與基礎設施的市場規模可能達到1萬億美元。

隨著AI應用從模型訓練逐漸轉向大規模推理與Agent系統，英偉達正在嘗試重新定義整個產業的技術路徑與商業邏輯。

從GPU到AI系統：Vera Rubin架構登場

本屆大會最重要的技術發布，是英偉達下一代AI計算平臺NVIDIA Vera Rubin。與過去推出單一GPU不同，這一次英偉達強調的是系統級架構：從GPU、CPU到網絡互聯與軟件框架全部進行垂直整合。

黃仁勛在舞臺上展示的不是一塊芯片，而是一整套機架級計算系統，其設計目標是把整個數據中心視為一臺超級計算機進行優化。

核心計算組件Rubin GPU采用臺積電3nm工藝和雙芯片封裝設計，擁有3360億晶體管，配備288GB HBM4顯存和22TB/s帶寬，AI推理性能達到約50 PFLOPs。

配套的Vera CPU則采用定制Arm架構，擁有88個核心和176線程，并在數據中心環境中首次采用LPDDR5內存，針對AI Agent場景下的高單線程性能和數據處理需求進行了優化。

英偉達表示，這一CPU如果單獨銷售也有可能成為一個數十億美元規模的業務。

Groq加入：為AI推理設計的新型芯片

隨著生成式AI進入應用階段，推理計算成為新的性能瓶頸。GPU在高吞吐并行計算方面具有優勢，但在極高速度的token生成階段效率會下降。

而Groq的LPU采用完全不同的設計思路：確定性數據流架構以及大量SRAM存儲，通過編譯階段完成調度，從而顯著降低運行時延遲。

這種結構非常適合token生成，但SRAM容量有限，單顆芯片只有約500MB，無法直接容納大型模型。

英偉達提出的解決方案是將推理任務拆分：GPU負責prefill和attention等需要大算力和大內存的部分，而LPU負責decode與token生成。這種架構被稱為disaggregated inference（解耦推理），兩種處理器通過高速網絡協同工作，從而在高吞吐和低延遲之間取得平衡。

Agent時代的軟件生態

除了硬件層面的升級，英偉達在軟件生態方面也提出新的戰略。

隨著AI Agent技術迅速發展，黃仁勛將開源框架OpenClaw定義為一種新的計算平臺，并將其與Windows、Linux和Kubernetes等基礎軟件相提并論。在這一框架之上，英偉達推出NemoClaw，為企業部署Agent系統提供安全與管理能力，包括策略控制接口、網絡訪問邊界以及數據隱私保護機制。

英偉達將這一關系類比為CUDA與GPU生態之間的關系：OpenClaw提供Agent操作系統，而NemoClaw則提供企業級開發平臺和工具鏈。與此同時，英偉達還宣布成立Nemotron Coalition，推動多種AI模型的發展，包括語言模型、機器人模型、自動駕駛模型以及氣候模擬系統等。

數據中心成為“Token工廠”

在技術之外，黃仁勛還提出了一種新的AI產業敘事：未來的數據中心將成為生產Token的工廠。

“數據中心是生產token的工廠；推理是工作負載，token是新商品，算力等于營收；未來每個CEO都要盯著自己token工廠的效能看。”

在他看來，AI的發展正經歷新的拐點。從聊天機器人到具備推理能力的系統，再到能夠執行任務的Agent，每一次能力躍遷都會顯著增加單次推理所需的算力，同時也推動整體使用量快速增長。基于這一趨勢，英偉達提出了新的AI服務分層模型，從免費層到Ultra層，對應不同模型規模、上下文長度和響應速度，同時也對應不同的token價格。

在這一體系下，算力基礎設施直接決定了AI服務的經濟可行性，而更高端的AI服務則需要更強大的計算平臺。

AI進入太空

在GTC大會上，英偉達還公布了一項更加前瞻性的計劃：將AI計算能力擴展到軌道數據中心。

公司發布了NVIDIA Space-1 Vera Rubin模塊，其AI計算能力據稱可達到NVIDIA H100GPU 的約25倍。黃仁勛在聲明中表示：“太空計算，這片最后的疆域，已經到來。隨著我們部署衛星星座并深入探索太空，智能必須存在于數據產生的任何地方。”

目前，包括Axiom Space、Planet Labs和Kepler Communications等企業已經在使用英偉達計算平臺執行空間任務。隨著衛星網絡和軌道數據處理需求增加，太空計算將是未來AI基礎設施中重要的一環。

AI進入更多產業場景

圍繞AI基礎設施，英偉達在多個產業領域也宣布了新的合作。例如IBM將把GPU加速能力整合到其AI數據平臺watsonx.data中，通過GPU原生數據分析提升企業數據處理效率。在測試案例中，數據查詢時間從傳統CPU環境下的約15分鐘縮短至約3分鐘，同時顯著降低成本。

同時，Amazon也宣布與英偉達合作，將NVIDIA DRIVE AGX車載計算平臺與Amazon Alexa Custom Assistant結合，用于打造能夠理解自然語言和環境語境的車載AI助手。

在計算機圖形領域，英偉達還發布了NVIDIA DLSS 5技術，通過神經渲染模型增強游戲畫面質量，使實時渲染更接近電影級視覺效果。黃仁勛稱其為“圖形技術的GPT時刻”。

Feynman架構提前曝光

根據規劃，Blackwell架構之后將是2026年的Vera Rubin，隨后在2027年推出Rubin Ultra，而2028年則會迎來全新的NVIDIA Feynman架構。

Feynman將對整個系統進行全面升級，包括新GPU、LP40 LPU、Rosa CPU以及下一代NVLink互聯。與此同時，新一代Kyber機架結構也將改變計算節點的布局方式，以支持更高密度的GPU部署。這種按年度更新的節奏顯示出英偉達試圖以更快速度推動AI基礎設施迭代。

本屆GTC展示的并不僅是新芯片，而是一套新的AI產業邏輯。

更多>同類資訊

三星發布HBM4E，深化與英偉達AI基礎設施合作

03-17

“龍蝦”也翻車？360 回應私鑰泄露事件：系發布失誤，證書已緊急吊銷

03-17

Picsart推出AI代理市場:支持創作者“雇傭”自主助手處理復雜任務

03-17

港大團隊重磅開源！一行命令讓任意軟件秒變AI Agent“原生工具”，再見UI自動化崩潰噩夢

03-17

英偉達Vera Rubin平臺亮相：256個LPU機架助力AI推理性能與性價比雙提升

03-17

三星GTC 2026發布HBM4E內存，與英偉達攜手拓展AI基礎設施新版圖

03-17

GTC大會啟幕：黃仁勛慶CUDA 20周年，稱Token為AI基石且英偉達成本最低

03-17

蘋果LiTo模型突破3D重建瓶頸：單張圖像生成3D對象，光影還原度再升級

03-17

360“安全龍蝦”私鑰泄露引關注涉事證書已吊銷普通用戶無虞

03-17

黃仁勛GTC發布野心藍圖：AI芯片領航，從地面到太空全面布局

03-17

英偉達2026-2028路線圖更新：Feynman GPU配3D封裝，下代CPU Rosa亮相

03-17

英偉達GTC 2026發布醫療機器人AI新成果：數據集、模型及開發藍圖齊亮相

IT之家了解到，Open-H 擁有 776 小時的手術視頻，包含 11 個機器人系統實例和 4 項手術適應癥；Cosmos-H模型支持通過提示、圖片、視頻評估醫療機器人決策；GR00T-H 模型可處理描述…

03-17

北京全球首啟智慧康養機器人養老驛站 40余款智能設備助力“科技養老”

近日，全球首個智慧康養機器人養老驛站在北京亦莊正式啟動運營，這座融合了40余款智能機器人的養老驛站打造了基礎服務、機器人應用、適老化改造三大核心場景，實現了“科技+養老”的深度融合。其中餐廚區實現用餐全流程智…

03-17

英偉達GTC大會：黃仁勛力推“龍蝦戰略”，OpenClaw與NemoClaw引領AI新變革

OpenClaw的創作者Peter Steinberger（已被OpenAI挖走，但項目保留開源）在一份聲明中力挺英偉達的商業化嘗試：“借助英偉達和更廣泛的生態系統，我們正在構建智能體和護欄，讓任何人都能創…

03-17

英偉達GTC大會：黃仁勛力推OpenClaw 發布NemoClaw布局AI新賽道

【環球網科技綜合報道】3月17日消息，據Business Insider報道，在今年GTC大會上，英偉達創始人兼CEO黃仁勛發表主題演講，聚焦AI智能體發展趨勢，呼吁全球企業制定專屬的OpenClaw戰略，…

03-17

點擊查看更多 +

全站最新

澳股收漲0.36%

英偉達GTC引爆“Token第一股”迅策(3317.HK)

A股部分化工股走強，中復神鷹漲近19%

臺股收漲1.44%

A股銀行股逆勢上漲，五大行均漲超1%

飛速創新(03355.HK)招股中，AI革命浪潮"賣鏟人"填補港股賽道空缺

熱門內容

本欄最新

N7青春版10萬級入場，東風日產以高配低價重塑純電市場質價比新標桿

極氪8X官圖亮相！超級電混高性能SUV，年輕設計搭配尖端科技來襲

極氪8X技術革新：900V超快充+高階智駕，引領混動SUV新潮流

零跑汽車加速智駕布局：2026年將推全國覆蓋領航輔助，全年盈利創佳績

上汽大眾ID. ERA技術發布會啟幕 “人本科技”領航九大黑科技賦能智能出行

AI時代：公司數量或減，個人能力放大，你準備好做破局者了嗎？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

從GPU到「Token工廠」，黃仁勛講了一個萬億美元的AI未來