3 月 16 日消息,亞馬遜 AWS 與晶圓級(jí) AI 芯片企業(yè) Cerebras 美國當(dāng)?shù)貢r(shí)間本月 13 日宣布,亞馬遜的 Amazon Bedrock 平臺(tái)在未來數(shù)月將部署結(jié)合雙方芯片產(chǎn)品的混合 AI 推理系統(tǒng),帶來最快的負(fù)載處理速度。
這一解決方案將結(jié)合 Cerebras 的 CS-3 系統(tǒng)、亞馬遜 AWS 的 Trainium 芯片和亞馬遜 AWS 的 EFA 彈性網(wǎng)絡(luò)適配器,由 Trainium 芯片負(fù)責(zé)推理的預(yù)填充(提示處理),而 CS-3 則承擔(dān)解碼(輸出生成任務(wù)),兩者通過 EFA 連接在一起。
了解到,推理預(yù)填充屬于并行工作負(fù)載,要求大算力和適中的內(nèi)存帶寬;推理解碼本質(zhì)上是串行的,算力要求較小但內(nèi)存帶寬要求高。組合使用 Trainium 和 CS-3 能發(fā)揮兩款 AI 芯片各自的長(zhǎng)處,提供最佳的最終用戶體驗(yàn)。(溯波)












