3月10日,英偉達(dá)創(chuàng)始人黃仁勛罕見地發(fā)布了一篇博客,并提出了一個(gè)根本性的范式轉(zhuǎn)換:
AI不再是預(yù)先編寫的軟件,而是實(shí)時(shí)生成的智能。
人工智能也并非單一的模型或應(yīng)用程序,而是如同電力和互聯(lián)網(wǎng)一樣必不可少的基礎(chǔ)設(shè)施。
這一論斷看似超前,但背后卻有一套清晰的架構(gòu)邏輯支撐:
能源→芯片→基礎(chǔ)設(shè)施→模型→應(yīng)用
自下而上遞進(jìn),上層需求拉動(dòng)下層投入,形成動(dòng)態(tài)傳導(dǎo)的技術(shù)棧。這并非簡(jiǎn)單的分層,而是物理約束逐級(jí)向上傳導(dǎo)的鏈條。
近幾年來(lái),智能已經(jīng)從預(yù)存指令的檢索發(fā)展到實(shí)時(shí)生成的推理,而整個(gè)計(jì)算范式也正在悄無(wú)聲息地發(fā)生根本性重構(gòu)。
01
范式轉(zhuǎn)換:從預(yù)制的軟件到實(shí)時(shí)的智能
氛圍編程(Vibe Coding)概念興起之前,在那些經(jīng)歷過傳統(tǒng)計(jì)算時(shí)代的老一代程序員們眼中,軟件必須依賴于人類預(yù)設(shè)的算法,數(shù)據(jù)必須經(jīng)過結(jié)構(gòu)化處理才能被檢索。
但短短幾年,AI就輕松打破了這個(gè)流傳了幾十年的經(jīng)典模式:
計(jì)算機(jī)已經(jīng)能夠理解圖像、文本、聲音等非結(jié)構(gòu)化信息,并根據(jù)上下文實(shí)時(shí)生成回應(yīng)。
在黃仁勛看來(lái),AI的每次推理都是一次全新的創(chuàng)造實(shí)踐,因此支撐智能生成的底層AI架構(gòu)也必須重新設(shè)計(jì)。
在他設(shè)想的五層架構(gòu)中,能源被置于最底層,而且不存在“抽象層”。
Transformer架構(gòu)中,注意力機(jī)制下生成的每一個(gè)token,本質(zhì)上都是電子流動(dòng)、熱量管理和能量轉(zhuǎn)化為計(jì)算的結(jié)果。
能源不僅是成本,還是物理層面上智能生產(chǎn)規(guī)模的上限。
自此之上,芯片決定算力轉(zhuǎn)化的效率,基礎(chǔ)設(shè)施成為芯片集群的工廠,模型理解多領(lǐng)域的知識(shí),而應(yīng)用最后承載商業(yè)價(jià)值。
在這個(gè)架構(gòu)上運(yùn)行的鏈條,任何一層存在瓶頸都會(huì)極大程度上制約智能生成的整體規(guī)模。
對(duì)于英偉達(dá)和同在美國(guó)的Google、OpenAI等龍頭企業(yè)來(lái)說(shuō),芯片、基礎(chǔ)設(shè)施和模型三個(gè)層級(jí)基本已經(jīng)打通,毫無(wú)疑問處于世界領(lǐng)先水平,但底層的能源仍是最大的限制。
不惜成本建設(shè)數(shù)據(jù)中心以及積極探索太空算力等舉措足以證明底層能源的限制對(duì)上層應(yīng)用的商業(yè)路徑產(chǎn)生極大阻礙。
如果將這一框架置于國(guó)內(nèi)產(chǎn)業(yè)環(huán)境之中,約束與機(jī)會(huì)同樣并存。
在能源供給方面,中國(guó)在電力基礎(chǔ)設(shè)施上具備絕對(duì)優(yōu)勢(shì),但芯片和高帶寬內(nèi)存(HBM)等環(huán)節(jié)明顯受制于國(guó)際供應(yīng)鏈,目前國(guó)產(chǎn)算力在訓(xùn)練階段的集群性能和生態(tài)適配上都存在顯著差距,且差距有增加的趨勢(shì)。
但需要注意的是,推理階段的需求已經(jīng)呈現(xiàn)出差異化。通過模型量化、混合專家架構(gòu)等優(yōu)化手段,中端芯片亦可支持多數(shù)應(yīng)用場(chǎng)景,而這正是讓黃仁勛贊不絕口的DeepSeek最擅長(zhǎng)的領(lǐng)域。
但現(xiàn)階段,要在基礎(chǔ)模型能力上追逐國(guó)際頂尖水平仍顯得不切實(shí)際。但結(jié)合此前的判斷:智能體爆發(fā)加上AI能力溢出讓模型之間的差距被壓縮,國(guó)產(chǎn)模型和國(guó)際頂尖模型之間的體驗(yàn)差距已經(jīng)小于參數(shù)差距。
應(yīng)用層若是能精準(zhǔn)定位“夠用就好”的需求區(qū)間,國(guó)產(chǎn)模型憑借極致的性價(jià)比就必然存在局部突圍的可能性。
02
戰(zhàn)略轉(zhuǎn)向:從硬件綁定到生態(tài)連接
面對(duì)一只龍蝦引起的應(yīng)用層爆發(fā),英偉達(dá)的策略也發(fā)生了微妙的變化。
根據(jù)Wired報(bào)道,英偉達(dá)也正在走國(guó)內(nèi)AI企業(yè)的養(yǎng)蝦之路,計(jì)劃推出開源AI代理平臺(tái)NemoClaw。
但不同之處在于,國(guó)內(nèi)AI企業(yè)幾乎將幾個(gè)月前手機(jī)助手問世時(shí)的場(chǎng)面原封不動(dòng)又復(fù)刻了一遍:開源項(xiàng)目誕生后,各家接連推出自己的類似功能產(chǎn)品,然后關(guān)閉生態(tài),各自傾銷自己的滯銷token。
而英偉達(dá)選擇了開源,且無(wú)論企業(yè)是否使用英偉達(dá)芯片都可以接入平臺(tái),同時(shí)提供了安全與隱私工具以應(yīng)對(duì)企業(yè)級(jí)部署的可靠性挑戰(zhàn)。
它沒有做第一批養(yǎng)蝦的企業(yè),卻從軟件和硬件層面上提供了最適合養(yǎng)蝦的“水缸”。
與此同時(shí),英偉達(dá)也發(fā)現(xiàn),如果它在人們心中的印象還是那個(gè)GPU企業(yè),那就不可能在大模型和智能體領(lǐng)域內(nèi)占據(jù)如今硬件領(lǐng)域的地位。
因此,這一舉措取消了此前的平臺(tái)大多要求企業(yè)使用自家芯片的限制。不過,這并非放棄了硬件層面上的底層優(yōu)勢(shì),而是通過降低參與門檻,把自身的角色升級(jí)成了“代理生態(tài)的基礎(chǔ)設(shè)施提供方”,試圖成為代理任務(wù)的默認(rèn)運(yùn)行環(huán)境。
在這篇博客中,雖然沒有明說(shuō),但黃仁勛想要表達(dá)的意思很明確:
當(dāng)代理任務(wù)成為連接應(yīng)用和底層算力的核心時(shí),誰(shuí)能定義調(diào)度規(guī)則,誰(shuí)就能在五層架構(gòu)的傳導(dǎo)鏈條中占據(jù)上游的議價(jià)權(quán)。
而這里的調(diào)度規(guī)則,至少會(huì)包含以下三個(gè)維度:
一是模型路由:誰(shuí)能定義路由算法,誰(shuí)就能決定流量流向哪個(gè)模型廠商;
二是工具與工作流編排:誰(shuí)定義工具調(diào)用的API和執(zhí)行順序,誰(shuí)就能決定企業(yè)軟件被AI調(diào)用的方式;
三是算力映射:誰(shuí)定義任務(wù)對(duì)算力的需求特征,誰(shuí)就能決定底層芯片的設(shè)計(jì)方向。
與其被動(dòng)響應(yīng)需求,不如主動(dòng)定義需求。
同期的另一項(xiàng)計(jì)劃也顯示出英偉達(dá)轉(zhuǎn)型的決心:
英偉達(dá)預(yù)計(jì)在未來(lái)五年內(nèi)投入260億美元開發(fā)一款開放權(quán)重的模型。
所謂開放權(quán)重,就是公開模型的參數(shù),但保留許可限制,既能滿足企業(yè)對(duì)透明度與定制化的需求,又能憑借最擅長(zhǎng)的軟硬件協(xié)同優(yōu)化能力維持技術(shù)主導(dǎo)權(quán)。
根據(jù)英偉達(dá)高管透露的信息,該模型的研發(fā)除了提供AI能力以外,更重要的目的是對(duì)存儲(chǔ)、網(wǎng)絡(luò)和數(shù)據(jù)中心進(jìn)行一次極限壓力測(cè)試,以此定義下一代硬件架構(gòu)。
據(jù)稱,國(guó)產(chǎn)模型DeepSeek-V4可能完全由華為昇騰系列芯片訓(xùn)練,此后國(guó)產(chǎn)算力可能在國(guó)產(chǎn)模型的訓(xùn)練中所占比重逐步上升;而英偉達(dá)的首款模型預(yù)計(jì)在2026年底或2027年初問世。據(jù)此推算,這一時(shí)間窗口會(huì)與全球算力格局演變的關(guān)鍵周期高度重疊。
03
應(yīng)用挑戰(zhàn):從“能執(zhí)行”到“可信執(zhí)行”
當(dāng)黃仁勛口中的“智能”自上而下扎根于物理設(shè)施的同時(shí),自下而上也在面臨著應(yīng)用層的可靠性挑戰(zhàn)。
NemoClaw平臺(tái)明確指向企業(yè)級(jí)市場(chǎng)的底氣,正是著重強(qiáng)調(diào)的安全與隱私工具。
英偉達(dá)的動(dòng)向,恰好回應(yīng)了當(dāng)前代理技術(shù)最核心的矛盾:模型能力的提升無(wú)法直接轉(zhuǎn)化為生產(chǎn)環(huán)境的可靠性。
在實(shí)際的生產(chǎn)環(huán)境中,規(guī)模化運(yùn)營(yíng)的公司絕不會(huì)輕易使用OpenClaw這種高風(fēng)險(xiǎn)的產(chǎn)品。
一周之前,DeepLearning.AI創(chuàng)始人吳恩達(dá)博士在一次訪談中也明確指出:高風(fēng)險(xiǎn)企業(yè)應(yīng)用中,完全自主的模型與生產(chǎn)級(jí)可靠性之間仍有巨大缺口。
無(wú)論是此前的大語(yǔ)言模型、如今的智能體還是未來(lái)的通用人工智能(AGI),人們對(duì)AI的核心需求其實(shí)從未改變:自動(dòng)化執(zhí)行任務(wù)。
這就意味著,AI產(chǎn)品的設(shè)計(jì)理念中必須包含智能自主決策。智能化和自主化程度越高,離人們的目標(biāo)就越近。
但在實(shí)際業(yè)務(wù)場(chǎng)景中,容錯(cuò)率低的嚇人,系統(tǒng)需要經(jīng)過成千上萬(wàn)次運(yùn)行后依然保持穩(wěn)定,這需要精細(xì)的工作流設(shè)計(jì)和分布驗(yàn)證,而不僅僅依賴模型的“智商”。
英偉達(dá)在平臺(tái)中引入安全審計(jì)和權(quán)限管控等相關(guān)機(jī)制,是目前國(guó)內(nèi)外各種“Claw產(chǎn)品”最欠缺的部分。
代理工具的價(jià)值早已不是“能否執(zhí)行”,而是如何“可控執(zhí)行”。
Perplexity近期提出的“Everything is Computer”就是這一命題最好的實(shí)證參考。
其企業(yè)級(jí)方案在金融研究場(chǎng)景中實(shí)現(xiàn)了“16000次查詢節(jié)省160萬(wàn)美元人力成本”效果的同時(shí),也設(shè)計(jì)了敏感操作審批、完整審計(jì)軌跡、緊急中止開關(guān)等安全機(jī)制,回應(yīng)了企業(yè)對(duì)于代理工具不可預(yù)測(cè)性的擔(dān)憂。
事實(shí)證明,基礎(chǔ)模型在達(dá)到一定閾值后,決定用戶體驗(yàn)的就不再是參數(shù)規(guī)模,而是產(chǎn)品如何管理風(fēng)險(xiǎn)、嵌入流程并驗(yàn)證結(jié)果。
04
結(jié)語(yǔ):早期階段的選擇
英偉達(dá)的一系列動(dòng)作,把一個(gè)根本的問題擺在了國(guó)產(chǎn)AI企業(yè)的眼前:
當(dāng)基礎(chǔ)設(shè)施的定義權(quán)已經(jīng)集中于全棧廠商,后來(lái)者還有什么機(jī)會(huì)?
吳恩達(dá)提出的觀點(diǎn)或許是這個(gè)問題的最好回答:
垂直領(lǐng)域AI服務(wù)于特定行業(yè)的能力,其增長(zhǎng)速度將遠(yuǎn)超對(duì)AGI的期待。
在訓(xùn)練算力受限、推理算力有替代方案的情況下,放棄高精尖領(lǐng)域,聚焦高頻剛需場(chǎng)景反而容易在體驗(yàn)層面上實(shí)現(xiàn)反超。
就像黃仁勛在博客結(jié)尾所說(shuō),人類仍處于AI基礎(chǔ)設(shè)施建設(shè)的早期階段,大語(yǔ)言模型和智能體都不會(huì)是AI發(fā)展的最終形態(tài),大量機(jī)遇尚未發(fā)掘。
對(duì)于全球絕大部分開發(fā)者而言,復(fù)制全棧巨頭的路徑絕非明智之舉,只會(huì)像OpenClaw一樣營(yíng)造出大量偽需求。
真正的機(jī)會(huì),是在約束條件下探索更貼合本土場(chǎng)景的智能系統(tǒng)。
當(dāng)應(yīng)用層開始反向定義技術(shù)棧,AI能力溢出就變成了戰(zhàn)略機(jī)會(huì)。
國(guó)產(chǎn)模型在智能體時(shí)代已經(jīng)與國(guó)際頂尖模型縮小了參數(shù)上的差距,后續(xù)發(fā)展的關(guān)鍵就在于產(chǎn)品如何跨越“能用”和“好用”之間的臨界點(diǎn)。
可以確信的是,免費(fèi)奶茶營(yíng)銷留不住的用戶,缺乏場(chǎng)景耦合的代理工具同樣留不住。
只有找到普通用戶也愿意為之付費(fèi)的價(jià)值點(diǎn),應(yīng)用層才能真正拉動(dòng)下層技術(shù)投入,形成正向循環(huán)。
智能的物理基座已經(jīng)開始澆筑,應(yīng)用層的真實(shí)價(jià)值將決定基座能承載多大的經(jīng)濟(jì)規(guī)模。







