近期,英偉達H100芯片在算力租賃市場掀起價格熱潮,其租賃價格呈現(xiàn)顯著上漲態(tài)勢。半導(dǎo)體研究機構(gòu)SemiAnalysis發(fā)布的“H100一年期租賃合約價格指數(shù)”顯示,這款于2022年3月發(fā)布、秋季開始出貨的芯片,租賃合約價格自2025年10月觸及每小時1.7美元的低點后,在今年3月已飆升至每小時每塊GPU 2.35美元,漲幅接近40%。
該指數(shù)基于對100多家云服務(wù)提供商、算力資源買賣雙方的直接調(diào)查數(shù)據(jù)構(gòu)建,每月更新一次。最新報告指出,當前按需租用的GPU算力在各類GPU中均已售罄。即便近期價格持續(xù)攀升,已鎖定按需實例的客戶仍不愿將算力釋放回資源池。研究人員形象地比喻,在2026年初尋找GPU算力,如同預(yù)訂“最后一班離開航班”的機票——價格高昂且資源稀缺。
市場搶購GPU算力的熱情高漲。客戶正以每塊GPU每小時14美元的價格爭搶亞馬遜云服務(wù)的p6-b200競價實例,部分新興云服務(wù)巨頭甚至停止單節(jié)點銷售。更值得注意的是,部分英偉達H100 GPU仍按2—3年前簽訂的原價續(xù)約,部分合同甚至直接續(xù)簽至2028年。
盡管市場曾預(yù)期性能更強、算力成本更低的Blackwell芯片加速部署會壓制H100價格,但現(xiàn)實情況截然相反。由于開放權(quán)重模型需求強勁及推理需求激增,新部署的Blackwell芯片交付周期已延長至6—7個月。與此同時,H100的市場需求不僅未減弱,反而在多領(lǐng)域呈現(xiàn)增強態(tài)勢。
SemiAnalysis在報告中分析,今年初算力需求激增的主要驅(qū)動力來自原生媒體生成領(lǐng)域。字節(jié)跳動的Seedance(即夢)和谷歌的Nano Banana等應(yīng)用推動用戶大量生成和優(yōu)化視頻/圖像,導(dǎo)致詞元吞吐量大幅上升。更顯著的需求增長來自多智能體工作負載的興起,這類應(yīng)用使詞元使用量和算力消耗呈拋物線式增長。據(jù)該機構(gòu)透露,其自身在過去一周就消耗了數(shù)十億詞元,每百萬詞元成本約5美元,但由此節(jié)省的時間和工作流程擴展帶來的回報遠超算力成本。
與算力市場供需緊張形成鮮明對比的是,新興云服務(wù)商股價表現(xiàn)低迷。CoreWeave、Nebius等公司的股價處于過去6—12個月的區(qū)間低位。分析指出,市場仍普遍預(yù)期算力市場將出現(xiàn)供給過剩和商品化趨勢,但現(xiàn)實是,在供給緊張環(huán)境下,各類算力資源均保持旺盛需求,性能差異對需求的影響顯著弱化。
當前市場正密切關(guān)注三個關(guān)鍵變量:GB300集群在2026年的放量節(jié)奏能否緩解算力緊張;芯片短缺是否會進一步惡化;以及AI巨頭的年度經(jīng)常性收入擴張情況、AI應(yīng)用普及速度和詞元消耗規(guī)模的增長節(jié)奏。這些因素將共同決定GPU租賃價格能否維持高位運行。











