在2026年GTC大會美國加州圣何塞會場,英偉達面向智能體AI的長上下文推理需求,正式推出BlueField-4 STX模塊化存儲參考架構。這一創新方案旨在突破傳統數據中心存儲的性能瓶頸,為AI智能體的跨步驟交互提供硬件支撐。
傳統存儲架構在應對AI推理場景時暴露出明顯短板。當上下文信息量激增時,數據從存儲設備到計算單元的傳輸延遲會顯著拉低推理效率,導致GPU資源利用率驟降。這種矛盾在需要持續調用歷史數據的智能體應用中尤為突出,成為制約AI系統響應速度的關鍵因素。
STX架構通過重構存儲節點與計算資源的物理布局解決這一難題。其核心設計理念是將存儲單元深度集成至計算集群內部,使數據訪問路徑縮短至傳統架構的1/5。配合全新的NVIDIA CMX上下文內存存儲平臺,該架構實現了GPU內存的橫向擴展,在基準測試中展現出每秒處理Token數量提升5倍的性能表現。
硬件層面,STX架構基于Vera Rubin平臺構建,搭載的BlueField-4處理器集成了專為存儲優化的Vera CPU核心與ConnectX-9超級網卡。這種異構設計使單節點可同時處理存儲I/O與網絡通信任務,配合Spectrum-X以太網架構和DOCA軟件框架,形成完整的端到端加速方案。
實測數據顯示,采用STX架構的系統在能效比方面達到傳統CPU架構的4倍。在企業級AI數據處理場景中,其數據攝取速度實現翻倍增長,特別在每秒頁面處理量等關鍵指標上表現出色。這種性能躍升得益于架構對存儲-計算協同的深度優化,有效減少了數據搬運過程中的能量損耗。
英偉達首席執行官黃仁勛在主題演講中強調,智能體AI的進化正在重塑計算基礎設施的范式。他指出:"當AI系統需要同時處理百萬量級的上下文標記并保持持續學習能力時,存儲子系統必須從被動的數據倉庫轉變為智能的數據管道。"這一觀點直接指向STX架構的設計哲學。
產業合作方面,戴爾、HPE、IBM等存儲領域頭部企業已啟動基于STX的聯合研發項目。在云計算領域,甲骨文云(OCI)與Mistral AI成為首批技術采納者,計劃在下半年向市場推出商用化解決方案。這些合作將覆蓋從硬件定制到軟件優化的全鏈條,加速新型存儲架構的落地進程。










