OpenAI與Cerebras聯合宣布推出面向實時編程場景的GPT-5.3-Codex-Spark模型,這是雙方合作的首個公開技術成果。該模型以每秒超1000 tokens的推理速度實現近乎即時的代碼反饋,專門針對需要快速交互的軟件開發場景設計,現已通過"研究預覽"形式向特定用戶開放。
在軟件開發領域,"agentic coding"模式正引發變革——AI系統可在無人值守狀態下持續工作數小時甚至數天。但這種自動化趨勢也帶來新挑戰:開發者需要花費更多時間等待系統響應,且對開發過程的掌控力逐漸減弱。OpenAI特別指出,軟件開發本質是高度迭代的創造性工作,開發者需要實時調整方向、把控設計風格并做出關鍵決策。
針對這些痛點,Codex-Spark被定位為"高度專業化的輕量級模型",通過優化推理架構實現快速響應。在SWE-Bench Pro等專業基準測試中,該模型不僅任務完成速度較GPT-5.1-Codex-mini提升顯著,回答質量也獲得更高評分。其核心能力包括精準代碼修改、動態計劃調整以及基于代碼庫的上下文問答,特別適合界面布局可視化、樣式優化等需要快速驗證的場景。
支撐這一性能突破的是Cerebras的Wafer-Scale Engine芯片技術。該芯片配備行業領先的片上內存容量,單系統即可支持每秒數千token的推理需求,通過集群擴展更可將內存容量提升至TB級別,滿足萬億參數模型的訓練需求。OpenAI透露,計劃在2026年將這種超高速推理架構推廣至更大規模的前沿模型。
目前,Codex-Spark已通過ChatGPT Pro平臺向訂閱用戶推送,集成在Codex應用、命令行工具及VS Code擴展中。API訪問權限將分階段向合作伙伴開放,首批覆蓋軟件工程、交互設計等領域的企業用戶。這種分層次開放策略既保證技術驗證的充分性,也為后續功能迭代預留空間。











