滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

Taalas“硬連線”技術(shù)突破：集群方案助力DeepSeek R1實(shí)現(xiàn)近乎零延遲交互

時(shí)間：2026-02-21 14:36:41 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

在人工智能算力競(jìng)爭(zhēng)愈發(fā)白熱化的背景下，AI芯片初創(chuàng)企業(yè)Taalas推出了一項(xiàng)突破性技術(shù)——通過“硬連線”方式將AI模型直接固化在硅片中，試圖解決大模型推理延遲與成本高企的雙重難題。與傳統(tǒng)依賴高帶寬內(nèi)存（HBM）和復(fù)雜散熱系統(tǒng)的設(shè)計(jì)不同，該公司選擇專用集成電路（ASIC）路徑，開發(fā)出能將任意AI模型轉(zhuǎn)化為定制硅片的平臺(tái)，核心原理是將特定大語言模型（LLM）的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)直接映射至芯片電路，在DRAM級(jí)密度下完成全部計(jì)算。

這一設(shè)計(jì)從物理層面消除了數(shù)據(jù)傳輸?shù)摹皟?nèi)存墻”瓶頸。通過摒棄HBM、多層封裝及昂貴的散熱方案，Taalas的芯片在理論架構(gòu)上實(shí)現(xiàn)了計(jì)算與存儲(chǔ)的深度融合。其首款產(chǎn)品HC1專為meta的Llama 3.1 8B模型優(yōu)化，采用臺(tái)積電6nm制程工藝，芯片面積達(dá)815平方毫米，幾乎與英偉達(dá)H100相當(dāng)。盡管如此，該芯片僅能容納80億參數(shù)的模型，與當(dāng)前主流的萬億參數(shù)模型存在顯著差距，反映出硬連線技術(shù)在參數(shù)密度上的天然限制。

性能測(cè)試數(shù)據(jù)顯示，HC1在特定條件下可實(shí)現(xiàn)每秒17,000個(gè)tokens的生成速度。在EE Times的實(shí)測(cè)中，其在線聊天機(jī)器人演示達(dá)到每秒15,000+ tokens的輸出能力。公司透露，這一成績(jī)部分得益于對(duì)Llama3.1-8B模型的“激進(jìn)量化”處理。更引人注目的是成本優(yōu)勢(shì)：相比現(xiàn)有高端算力方案，HC1的單位token生成成本降低至二十分之一，同時(shí)將推理速度提升10倍。

為彌補(bǔ)單芯片容量不足的問題，Taalas采用集群化擴(kuò)展策略。在針對(duì)DeepSeek R1模型的測(cè)試中，30芯片組成的集群系統(tǒng)實(shí)現(xiàn)每用戶12,000 TPS的吞吐量，遠(yuǎn)超當(dāng)前GPU集群約200 TPS/User的行業(yè)水平。這種架構(gòu)使實(shí)時(shí)交互場(chǎng)景中的延遲接近不可感知級(jí)別，特別適用于需要快速響應(yīng)的復(fù)雜推理任務(wù)。TPS（每秒Token數(shù)）作為衡量模型生成效率的核心指標(biāo)，其數(shù)值提升直接縮短了用戶等待時(shí)間，類似于提升打字員的輸入速度。

盡管技術(shù)參數(shù)亮眼，但Taalas的商業(yè)模式面臨特殊挑戰(zhàn)。由于模型權(quán)重被永久固化在芯片硬件中，客戶需為特定算法版本購買專用設(shè)備。這意味著一旦底層模型更新迭代，已部署的硬件可能面臨快速貶值的風(fēng)險(xiǎn)。行業(yè)分析師指出，這種“模型-芯片強(qiáng)綁定”的模式在算法進(jìn)化速度極快的AI領(lǐng)域，可能制約其長(zhǎng)期市場(chǎng)接受度。

02-21

抖音博主佑真素顏出鏡，高度還原蒂法神韻，網(wǎng)友直呼：天生麗質(zhì)難自棄

02-21

小米POCO X8 Pro系列外觀亮相，Pro Max版雙LED閃光燈成亮點(diǎn)

02-21

國產(chǎn)旗艦銷量大比拼：蘋果領(lǐng)跑，小米出海，華為追趕態(tài)勢(shì)猛

他第一個(gè)給出的是Pro Max版本的對(duì)比，信息顯示華為Mate 80 Pro Max開售11周，銷量為1.0X；小米17 ProMax開售20周，銷量為3.1X，iPhone 17 Pro Max開售21周…

02-21

小米平板8 Ultra或攜玄戒O2芯片登場(chǎng)，技術(shù)整合助力高端市場(chǎng)突圍

據(jù)供應(yīng)鏈消息，小米第二代自研SoC玄戒O2研發(fā)順利，預(yù)計(jì)采用臺(tái)積電N3P工藝，其應(yīng)用范圍也將從平板擴(kuò)展至汽車、電腦等多條產(chǎn)品線。若小米平板8Ultra搭載玄戒O2，將在能效與綜合性能上帶來提升。綜合來看…

02-21

春晚舞臺(tái)“意外”引爆市場(chǎng)：機(jī)器人從表演到家庭，技術(shù)落地正當(dāng)時(shí)

當(dāng)宇樹科技的機(jī)器人在《武BOT》節(jié)目中“摔倒”在地，隨即又一個(gè)鯉魚打挺站了起來，電視機(jī)前的觀眾們議論紛紛，“是故意的，還是失誤？” 以往機(jī)器人上春晚，多是拼穩(wěn)定性、拼隊(duì)形變換，這次《武BOT》卻讓技術(shù)去服務(wù)…

02-21

小米試產(chǎn)大容量電池，百瓦單電芯硅方案或助力旗艦新機(jī)升級(jí)

IT之家 2 月 21 日消息，博主 @數(shù)碼閑聊站今天在微博透露，某“糧廠”正在試產(chǎn)兩塊電池。IT之家在此援引博主表述，這兩塊電池中有一塊額定容量 7850mAh / 典型值 8000mAh±，另一塊額定…

02-21

雷軍“吹牛”變現(xiàn)實(shí)！小米YU7銷量超特斯拉，國產(chǎn)新能源崛起正當(dāng)時(shí)

02-21

馬斯克旗下xAI公司獲沙特AI企業(yè)HUMAIN投資30億美元

02-21

AI芯片之爭(zhēng)，谷歌欲砸錢“拉幫結(jié)派”對(duì)抗英偉達(dá)

02-21

維基百科創(chuàng)始人回應(yīng)AI競(jìng)爭(zhēng)

02-21

消息稱小米試產(chǎn)兩塊電池，典型值8000mAh±/8500mAh±

02-21

小米試產(chǎn)大容量電池百瓦單電芯硅方案或助力旗艦新機(jī)升級(jí)

02-21

小米POCO X8 Pro系列外觀細(xì)節(jié)揭曉，Pro Max版雙LED閃光燈成亮點(diǎn)

02-21

三星Galaxy Buds4與Pro耳機(jī)渲染圖亮相，設(shè)計(jì)配置細(xì)節(jié)全揭秘

02-21

點(diǎn)擊查看更多 +

全站最新

黃仁勛預(yù)熱GTC 2026：將推“世界前所未見”芯片突破技術(shù)極限引期待

反轉(zhuǎn)！巨佬賣飛7倍牛股，押中這家巨頭

2026加拿大國際車展經(jīng)典老爺車齊聚多倫多觀眾沉浸式感受汽車魅力

大眾集團(tuán)設(shè)計(jì)高層變動(dòng)：安德烈亞斯·明特3月1日接任設(shè)計(jì)新負(fù)責(zé)人

黃仁勛預(yù)熱GTC 2026：將推“世界未見”芯片突破技術(shù)極限引期待

設(shè)施升級(jí)效率升溫情服務(wù)暖人心各地多舉措保障春運(yùn)新能源車充電無憂

熱門內(nèi)容

本欄最新

雷軍“吹牛”變現(xiàn)實(shí)！小米YU7銷量超特斯拉，國產(chǎn)新能源崛起正當(dāng)時(shí)

武漢展新顏：AI賦能敦煌九色鹿 “鹿漫漫”讓千年文化煥新彩

預(yù)算十幾萬想選家用車？這3款安全耐用性價(jià)比高，開十年八年不操心

比亞迪Racco內(nèi)飾官圖亮相！復(fù)古設(shè)計(jì)+實(shí)用空間 2026年日本上市引期待

特斯拉Cybercab下線：無方向盤踏板后視鏡專為無人駕駛出租車打造

亞馬遜年度營(yíng)收首超沃爾瑪?shù)琼斎颍朴?jì)算業(yè)務(wù)成其制勝關(guān)鍵因素

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Taalas“硬連線”技術(shù)突破：集群方案助力DeepSeek R1實(shí)現(xiàn)近乎零延遲交互