AI推理芯片領(lǐng)域迎來新突破,初創(chuàng)企業(yè)Positron近日對外展示了其第二代ASIC芯片設(shè)計(jì)——Asimov。這款芯片被宣稱在Token能效與性價比方面表現(xiàn)卓越,可達(dá)到英偉達(dá)Rubin GPU的五倍水平,引發(fā)了行業(yè)廣泛關(guān)注。
Positron團(tuán)隊(duì)深入分析后指出,當(dāng)前Transformer推理運(yùn)行的主要瓶頸并非算力,而是內(nèi)存。基于這一洞察,Asimov芯片在設(shè)計(jì)上采取了內(nèi)存優(yōu)先的策略。通過優(yōu)化設(shè)計(jì),該芯片實(shí)現(xiàn)了高達(dá)90%的內(nèi)存帶寬利用率,同時從架構(gòu)層面減少了不必要的遠(yuǎn)程數(shù)據(jù)傳輸,有效提升了數(shù)據(jù)處理效率。
從硬件配置來看,Asimov芯片由兩個計(jì)算模塊構(gòu)成,每個模塊均配備了支持多種數(shù)據(jù)格式的脈動陣列。在內(nèi)存方面,每個計(jì)算模塊直接連接432GB的LPDDR5x內(nèi)存,并通過PCIe 6.0或CXL 3.0接口連接至多720GB的KV Cache緩存內(nèi)存。整個芯片的熱設(shè)計(jì)功耗(TDP)為400W,內(nèi)存總?cè)萘扛哌_(dá)2304GB,總帶寬達(dá)到2.76 TB/s,且支持風(fēng)冷散熱方案。
在系統(tǒng)集成方面,Asimov芯片支持16Tbps的芯片間互聯(lián),可構(gòu)建多樣化的拓?fù)浣Y(jié)構(gòu)。其推出的Titan推理服務(wù)器系統(tǒng)采用19英寸4U機(jī)架規(guī)格,集成了4顆Asimov芯片。該系統(tǒng)能夠支持16T參數(shù)模型的推理任務(wù),并具備10M的上下文窗口容量。更引人注目的是,單個系統(tǒng)最多可擴(kuò)展至4096套Titan,展現(xiàn)出強(qiáng)大的擴(kuò)展能力。
據(jù)Positron公司透露,Asimov芯片的研發(fā)工作正在穩(wěn)步推進(jìn),目標(biāo)是在2026年底完成芯片流片,并計(jì)劃于2027年初正式投入量產(chǎn)。這一時間表的公布,讓業(yè)界對這款芯片的實(shí)際表現(xiàn)充滿期待。











