AI推理芯片領域迎來新突破,初創(chuàng)企業(yè)Positron近日正式對外披露其第二代專用集成電路(ASIC)設計——Asimov芯片。據企業(yè)宣稱,這款芯片在Token能效與成本效益方面均達到英偉達Rubin GPU的五倍水平,引發(fā)行業(yè)廣泛關注。
與傳統(tǒng)GPU設計思路不同,Positron團隊將研發(fā)重點聚焦于內存架構優(yōu)化。針對Transformer模型推理過程中內存帶寬瓶頸問題,Asimov通過硬件級創(chuàng)新實現90%的內存帶寬利用率,同時重構數據流動路徑,從芯片架構層面消除冗余的遠程數據傳輸操作。這種設計理念使芯片在處理大規(guī)模模型時具備顯著優(yōu)勢。
在硬件配置方面,Asimov采用雙計算模塊架構,每個模塊集成432GB LPDDR5x內存,并通過PCIe 6.0與CXL 3.0混合接口連接最高720GB的KV Cache專用緩存。芯片整體熱設計功耗(TDP)控制在400W,內存總容量達2304GB,峰值帶寬突破2.76TB/s,支持標準風冷散熱方案。這種配置使其在保持高算力密度的同時,兼顧了數據中心部署的可行性。
系統(tǒng)級創(chuàng)新同樣值得關注。Asimov支持16Tbps芯片間高速互聯(lián),可構建多樣化拓撲網絡。其配套的Titan推理服務器采用19英寸4U標準機架,單系統(tǒng)集成4顆Asimov芯片,能夠實時處理16萬億參數規(guī)模的模型推理任務,并支持1000萬 tokens的上下文窗口。更引人注目的是,該系統(tǒng)支持多機并行擴展,單個數據中心單元最多可部署4096套Titan服務器。
據企業(yè)研發(fā)路線圖顯示,Asimov芯片已完成前端設計驗證,預計于2026年底進入流片階段。若進展順利,這款芯片將于2027年初啟動量產,屆時或將為AI大模型部署提供新的硬件解決方案。行業(yè)分析師指出,這種針對特定工作負載優(yōu)化的專用芯片,可能對現有GPU主導的市場格局產生沖擊。










