據(jù)知情人士透露,全球 AI 領(lǐng)軍企業(yè)OpenAI近期正積極系統(tǒng)性地尋找英偉達之外的算力替代方案。這一動作源于其對英偉達最新一代 AI 芯片在特定推理環(huán)節(jié)(尤其是響應(yīng)速度)表現(xiàn)的失望。
核心痛點:推理速度制約用戶體驗
OpenAI發(fā)現(xiàn),在代碼生成及復(fù)雜的軟件系統(tǒng)交互用例中,現(xiàn)有硬件的響應(yīng)速度已成為瓶頸:
戰(zhàn)略重心偏移:OpenAI正在將關(guān)注點從模型“訓(xùn)練”轉(zhuǎn)向“推理”(即向終端用戶輸出答案的過程)。
延遲與吞吐:推理階段的性能直接掛鉤用戶體驗與運營成本。在高帶寬、低延遲的特定任務(wù)下,傳統(tǒng) GPU 架構(gòu)因需頻繁訪問外置顯存而產(chǎn)生的延遲,讓芯片長時間處于“等數(shù)據(jù)”狀態(tài)。
專業(yè)用戶的高要求:CEO 山姆·奧特曼指出,開發(fā)者等專業(yè)用戶對代碼類模型的生成速度極度敏感,而當前的硬件架構(gòu)限制了相關(guān)產(chǎn)品的體驗。
替代方案:牽手推理加速“新勢力”
為了解決硬件瓶頸,OpenAI計劃引入新型硬件來分擔(dān)未來約10% 的推理算力需求:
引入 Cerebras:OpenAI已與 Cerebras 達成合作。后者的架構(gòu)在同一塊芯片中集成了海量靜態(tài)存儲(SRAM),能極大地縮短訪問路徑,提升響應(yīng)速度。
洽談 Groq:公司此前也曾與 Groq 接觸,尋求利用其推理加速特長來優(yōu)化聊天機器人等 AI 系統(tǒng)。
巨頭博弈:原本“板上釘釘”的投資生變
這種技術(shù)路線的調(diào)整也讓OpenAI與長期核心供應(yīng)商英偉達的關(guān)系變得微妙:
千億交易停滯:雙方原本正在洽談一項涉及1000億美元 的投資與供貨協(xié)議(英偉達以芯片換股權(quán)),但該談判已拖延數(shù)月。
采購多元化:OpenAI已經(jīng)與 AMD 等其他廠商簽署了新的 GPU 采購或合作協(xié)議,進一步分散了對單一供應(yīng)商的依賴。
競爭壓力:相比之下,Anthropic 的 Claude 以及谷歌的 Gemini 更多依賴谷歌自研的 TPU,這種專用芯片在推理任務(wù)上的天然優(yōu)勢給了英偉達巨大壓力。
盡管雙方在公開場合仍維持積極的合作形象,英偉達CEO 黃仁勛也極力否認不和傳聞,但隨著OpenAI開始真金白銀地為第三方推理芯片下單,AI 算力市場的“一超多強”格局正面臨重塑。











