全球人工智能領(lǐng)域迎來重大合作進展。OpenAI與美國AI芯片企業(yè)Cerebras達成戰(zhàn)略協(xié)議,計劃自2026年起分階段部署總?cè)萘窟_750兆瓦的晶圓級計算系統(tǒng),預(yù)計2028年全面建成后將成為全球規(guī)模最大的高速AI推理平臺。據(jù)CNBC披露,該合作項目估值超過100億美元,標(biāo)志著科技巨頭對推理算力的爭奪進入新階段。
Cerebras首席執(zhí)行官安德魯·費爾德曼強調(diào),此次合作將把全球頂尖的AI模型與全球最快的AI處理器深度融合。通過實時推理技術(shù),AI系統(tǒng)將徹底改變傳統(tǒng)交互模式,為開發(fā)者提供構(gòu)建新一代智能應(yīng)用的基礎(chǔ)設(shè)施。該公司自2015年成立以來,已開發(fā)出CS-2和CS-3兩代系統(tǒng),在醫(yī)學(xué)研究、密碼學(xué)、能源管理等領(lǐng)域?qū)崿F(xiàn)應(yīng)用,同時向全球開發(fā)者提供云端算力服務(wù)。
技術(shù)突破方面,Cerebras的晶圓級芯片設(shè)計具有革命性意義。該方案將傳統(tǒng)需要多芯片協(xié)同的計算單元、內(nèi)存和通信帶寬集成于單塊巨型芯片,有效解決了傳統(tǒng)GPU架構(gòu)的延遲瓶頸。測試數(shù)據(jù)顯示,在代碼生成和語音交互場景中,基于該架構(gòu)的大語言模型響應(yīng)速度較GPU方案提升最高達15倍,特別在需要深度邏輯推理的任務(wù)中表現(xiàn)尤為突出。
行業(yè)觀察指出,此次合作凸顯科技企業(yè)對推理效率的極致追求。回顧計算技術(shù)發(fā)展史,從千赫茲到吉赫茲的頻率躍遷催生了個人電腦產(chǎn)業(yè),而網(wǎng)絡(luò)帶寬的指數(shù)級提升則奠定了現(xiàn)代互聯(lián)網(wǎng)基礎(chǔ)。當(dāng)前AI領(lǐng)域正經(jīng)歷類似變革,低延遲推理技術(shù)不僅能提升用戶體驗,更將推動智能體應(yīng)用、實時決策系統(tǒng)等新興市場的生產(chǎn)力革命。
值得關(guān)注的是,AI芯片賽道競爭持續(xù)加劇。2025年12月,英偉達以200億美元現(xiàn)金收購低延遲處理器企業(yè)Groq,創(chuàng)下該公司最大規(guī)模收購紀(jì)錄。根據(jù)協(xié)議,英偉達將整合Groq的專用處理器技術(shù),強化其AI工廠架構(gòu)在實時推理場景的支撐能力,進一步鞏固在AI基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)導(dǎo)地位。
市場研究機構(gòu)分析,隨著大模型參數(shù)規(guī)模突破萬億級,推理環(huán)節(jié)的算力消耗已占整體AI應(yīng)用的60%以上。Cerebras與OpenAI的合作項目建成后,預(yù)計可支持每秒數(shù)千萬次的高并發(fā)推理請求,其能耗效率較現(xiàn)有數(shù)據(jù)中心提升40%,或?qū)⒅匦露xAI計算的行業(yè)標(biāo)準(zhǔn)。











