全球AI算力市場正經歷一場前所未有的供需失衡危機,從GPU硬件到數據中心基礎設施的各個環節均陷入價格飆升與供應短缺的雙重困境。研究機構SemiAnalysis最新數據顯示,H100 GPU的一年期租賃價格在五個月內從每小時1.70美元躍升至2.35美元,漲幅達38%,而所有型號的按需算力資源已全面告罄。
需求端的結構性突變成為此輪危機的核心推手。Anthropic的季度營收從90億美元暴增至250億美元,其Claude Code多智能體系統帶來的推理算力需求呈現指數級增長。開源模型生態的繁榮進一步加劇了這種趨勢,GLM、Kimi K2.5等模型的廣泛部署使推理工作負載規模持續擴大。AI代理技術的突破性進展更成為關鍵變量,這類需要持續迭代的高并發工作流使單任務算力消耗較傳統模式提升數十倍。
媒體生成領域的需求爆發同樣不容忽視。Seedance和Nano Banana等原生平臺引發的圖像視頻生成浪潮,推動單次訓練任務的算力需求突破PB級門檻。SemiAnalysis指出,當AI工具的投資回報率維持在5-10倍區間時,需求曲線表現出顯著的價格不敏感性,這為租金持續上漲預留了充足空間。
供給端的連鎖反應正在形成惡性循環。2026年初DRAM和NAND內存價格出現歷史性跳漲,LPDDR5和DDR5的合同價同比分別上漲400%和500%。服務器制造商趁機大幅提高整機報價,漲幅遠超元器件成本增幅,導致運營商項目回報率壓縮超30%。這種成本傳導機制迫使20%的新建數據中心項目延期,相當于每月減少約1.2萬塊GPU的有效供給。
Blackwell架構GPU的交付延遲成為新的制約因素。受開源權重模型訓練需求激增影響,新集群的部署周期已延長至6-7個月,較原計劃推遲近50%。這種供給滯后與需求激增的時間錯配,直接導致現貨市場出現每小時超過5美元的極端報價,盡管這類交易僅占市場總量的5%。
市場權力格局在六個月內發生根本性逆轉。曾經激烈競爭的Neocloud運營商如今掌握絕對議價權,通過提高預付款比例、延長合約期限等手段重構交易結構。某頭部運營商近期簽訂的三年期合約中,租金年復合增長率達22%,同時要求客戶承擔50%的硬件升級成本。
合約市場的分層特征愈發明顯。3個月以內的短期合約容量已徹底枯竭,持有者寧愿承受設備閑置風險也不愿釋放資源;1年期合約成為邊際需求的風向標,其價格波動直接反映市場緊張程度;4-5年期大宗交易則被超大規模實驗室壟斷,單筆交易規模突破50兆瓦,相當于預先鎖定2.4萬塊GB300 GPU的十年使用權。
資本市場對行業變革的反應顯著滯后。盡管CoreWeave等運營商的EBITDA利潤率突破45%,但其股價仍徘徊在去年低位。SemiAnalysis分析指出,市場仍受"技術商品化"預期主導,未能充分消化當前持續存在的供給約束。這種認知偏差使具備H100存量優勢和短期合約重定價能力的企業成為被低估的標的。
三個關鍵變量將決定市場走向:GB300集群的部署速度能否匹配需求增長、先進制程晶圓及存儲器的供應瓶頸何時緩解、AI實驗室營收增速能否維持現有斜率。SemiAnalysis監測數據顯示,當前臺積電N3產線的設備利用率已達98%,HBM3E的良品率仍不足60%,這些技術瓶頸可能使供給緊張延續至2027年。在上述變量出現實質性改善前,算力租金的上揚趨勢難以逆轉。











