滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

AI“推理時代”激戰(zhàn)正酣：英偉達布局降本，中國大模型性價比領(lǐng)跑全球

時間：2026-03-18 07:02:27 來源：快訊編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在近期舉辦的GTC（GPU技術(shù)大會）上，英偉達首席執(zhí)行官黃仁勛宣布，全球人工智能（AI）競爭的焦點正從模型訓(xùn)練轉(zhuǎn)向推理環(huán)節(jié)，標(biāo)志著AI產(chǎn)業(yè)進入“推理時代”。他指出，隨著AI從簡單的對話工具升級為能夠自主執(zhí)行復(fù)雜任務(wù)的智能體，持續(xù)生成海量Token（AI處理的最小數(shù)據(jù)單元）已成為行業(yè)核心需求。這場變革中，誰能以最低成本高效生成token，誰就能主導(dǎo)未來市場。

黃仁勛在演講中重申了“AI Token工廠”概念，強調(diào)數(shù)據(jù)中心的角色已從傳統(tǒng)“成本中心”轉(zhuǎn)變?yōu)椤皟r值創(chuàng)造中心”。他比喻道：“過去工廠將水轉(zhuǎn)化為電，如今數(shù)據(jù)中心將數(shù)據(jù)和電力轉(zhuǎn)化為高價值的token。”基于這一邏輯，英偉達推出新一代Vera Rubin計算平臺，宣稱其每瓦特推理性能較前代提升10倍，可將token生成成本降低90%。該平臺通過整合Groq公司的低延遲處理器（LPU），采用GPU與LPU混合架構(gòu)，分別處理高吞吐量任務(wù)與最終token生成，實現(xiàn)推理性能最高35倍的提升。

英偉達的野心不止于硬件創(chuàng)新。黃仁勛展示了一套覆蓋芯片、存儲、網(wǎng)絡(luò)到液冷系統(tǒng)的全棧解決方案，并推出數(shù)字孿生平臺NVIDIA DSX，幫助客戶在虛擬環(huán)境中模擬AI工廠運行，優(yōu)化能源效率。他直言：“加速計算是系統(tǒng)級工程，必須垂直整合。”這一戰(zhàn)略旨在將英偉達從芯片供應(yīng)商升級為AI基礎(chǔ)設(shè)施的“架構(gòu)師”與“規(guī)則制定者”。

然而，就在英偉達描繪技術(shù)藍圖時，中國AI廠商已憑借成本優(yōu)勢在全球推理市場占據(jù)主導(dǎo)地位。數(shù)據(jù)顯示，2026年2月以來，隨著智能體應(yīng)用OpenClaw等引發(fā)token消耗量激增，中國大模型憑借僅為國外競品1/6至1/10的token價格，在全球最大AI API平臺OpenRouter上連續(xù)多周超越美國同行。例如，Minimax M2.5模型運行一輪測試成本僅125美元，而Claude Opus 4.6和GPT-5.2-Codex分別高達4970美元和3244美元。

中國廠商的性價比優(yōu)勢源于兩方面：一是技術(shù)架構(gòu)創(chuàng)新。DeepSeek等企業(yè)通過多頭潛在注意力（MLA）、專家混合（MoE）架構(gòu)等技術(shù)壓縮計算資源需求，使模型在受限GPU環(huán)境下仍能保持高性能。二是電力成本優(yōu)勢。據(jù)測算，使用中國數(shù)據(jù)中心電力，單張英偉達B200芯片每年可節(jié)省900美元電費，全球范圍內(nèi)每年潛在節(jié)省空間達百億美元。

市場分析指出，推理環(huán)節(jié)更依賴用戶生態(tài)、電力效率與系統(tǒng)調(diào)度能力，而非單純追求芯片算力。這一趨勢正在縮小中美在AI基礎(chǔ)設(shè)施領(lǐng)域的差距。隨著全球token生成市場規(guī)模預(yù)計在2027年突破萬億美元，這場關(guān)于成本與效率的競爭將愈發(fā)激烈。

更多>同類資訊

英偉達GTC炸場！NemoClaw亮相，Vera Rubin算力飆升開啟新紀元

臺上，老黃展示了Vera Rubin系統(tǒng)，進化速度是肉眼可見的—— 老黃特別強調(diào)了一點：這是全球唯一一顆在數(shù)據(jù)中心使用LPDDR5的CPU。老黃在整場keynote里反復(fù)說的一句話是：英偉達是一家「垂直整…

03-18

技術(shù)為翼，生態(tài)為基：探路如何以復(fù)用技術(shù)構(gòu)建全場景出行新未來？

03-18

AI賦能家用咖啡機：從“玄學(xué)操作”到“科學(xué)適配”的體驗躍遷

03-18

吉利極氪8X首發(fā)超級Eva，階躍星辰“最強大腦”開啟智能出行新體驗

03-18

簡知科技九年探索：全齡覆蓋、技術(shù)賦能，讓終身學(xué)習(xí)融入生活每刻

03-18

東風(fēng)汽車“東風(fēng)太極大模型”成功備案開啟全場景智能協(xié)同新篇章

03-18

別克至境世家純電版上市，以超快充等優(yōu)勢領(lǐng)航豪華新能源MPV市場

03-18

小牛電動NXT2系列來襲！汽車級感知+AI大模型，智能騎行新體驗

03-18

普華永道報告：金融業(yè)擁抱AI，短期回報與長期價值雙豐收

03-18

浦東“00后”團隊全開源人形機器人：以開放之姿共赴智能未來之約

03-18

楊植麟團隊革新殘差連接，AttnRes架構(gòu)亮相，深度學(xué)習(xí)或迎新變革

03-18

華為Mate90系列亮點頻出：7500mAh固態(tài)電池+無孔屏，長期體驗或成新焦點

除了電池之外，Mate90在屏幕設(shè)計上也可能迎來一次比較大的變化。在視頻能力方面，新機可能支持8K60fps錄制，這也是目前旗艦手機影像發(fā)展的一個重要方向。如果手機真的能做到7500mAh電池、五年電…

03-18

光翼創(chuàng)新日本光伏展首發(fā)AI賦能"太陽翼" 引領(lǐng)太空光伏新篇章

(能動Nengdong2026年3月17日訊) 2026日本太陽能光伏展覽會（PV EXPO）于東京有明國際會展中心盛大開幕，全球柔性鈣鈦礦領(lǐng)軍企業(yè)光翼創(chuàng)新（Bilight）重磅登場，全球首發(fā)為AI賦能的…

03-18

Mistral Small4開源登場：“三位一體”架構(gòu)，性能與效率雙雙進階

03-18

長安汽車2026年定下330萬輛銷量目標(biāo) 2028年將實現(xiàn)人形機器人量產(chǎn)

03-18

點擊查看更多 +

全站最新

雷軍正式宣布：蘇炳添出任小米汽車品牌代言人，雙方合作再續(xù)新篇

小米汽車送福利！第一代SU7 YU7 Ultra首銷首任車主可領(lǐng)定制冰箱貼

蘇炳添成小米汽車代言人引熱議雷軍趣答：跑最快、是車主還姓SU

科大訊飛翻譯機4.0深度評測：無網(wǎng)絡(luò)也能譯，出國旅行溝通再無阻！

科大訊飛P30 Turbo學(xué)習(xí)機體驗：AI賦能個性化學(xué)習(xí)，護眼設(shè)計助力高效成長

蘇炳添成小米汽車代言人引熱議，雷軍幽默回應(yīng)：跑得快還姓SU很契合

熱門內(nèi)容

本欄最新

技術(shù)為翼，生態(tài)為基：探路如何以復(fù)用技術(shù)構(gòu)建全場景出行新未來？

長安汽車2026年定下330萬輛銷量目標(biāo) 2028年將實現(xiàn)人形機器人量產(chǎn)

看不見的豪華：5000萬歐元筑牢安全防線，奔馳詮釋電車匠心底色

華為乾崑與廣汽攜手推出啟境品牌首款中大型獵裝車GT7預(yù)計6月上市

別克至境世家純電版上市！900V 6C超快充，續(xù)航601km，售價48.99萬元

華為乾崑攜手廣汽推新品牌啟境首款中大型獵裝車GT7盲訂啟動

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AI“推理時代”激戰(zhàn)正酣：英偉達布局降本，中國大模型性價比領(lǐng)跑全球