2 月 5 日消息,AI 推理芯片初創企業 Positron 當地時間公布了其第二代 ASIC 設計 Asimov,宣稱該產品的 Token 能效與性價比都可以達到英偉達 Rubin GPU 的五倍。
Positron 表示 Transformer 推理運行的限制在內存而非算力,因此 Asimov 在設計上就是以內存優先,擁有 90% 的內存帶寬利用率,并從結構上消除不必要的遠程數據移動。
Asimov 芯片由一對計算模塊組成,內置支持多樣化數據格式的脈動陣列。每個計算模塊連接到 432GB 的 LPDDR5x 內存,并通過 PCIe 6.0 / CXL 3.0 連接到至多 720GB 的 KV Cache 緩存用內存。其芯片整體 TDP 為 400W,內存總容量 2304GB、總帶寬 2.76 TB/s,支持風冷冷卻。
Positron Asimov 支持多樣化拓撲結構的 16Tbps 芯片間互聯。其 Titan 推理服務器系統采用 19 英寸 4U 機架規格,聚合了 4 顆 Asimov 芯片,支持 16T 參數模型推理和 10M 上下文窗口,單系統最多 4096 套 Titan。
Positron 表示 Asimov 芯片目標在 2026 年底完成芯片流片,并在 2027 年初投入生產。











