岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

超越英偉達,天數(shù)智芯公布路線圖

   時間:2026-01-28 11:43:45 來源:半導(dǎo)體行業(yè)觀察編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

過去很長一段時間里,被人工智能帶火的GPGPU 行業(yè)的討論只是停留在一個相對安全、卻也相對空洞的層面:參數(shù)、峰值算力和制程等。但在大模型開始進入企業(yè)業(yè)務(wù)、科研生產(chǎn)和物理世界,很多人突然發(fā)現(xiàn)——算力不再是“有沒有”,而是“好不好用、值不值這個價”。

作為算力的主力,GPGPU 也進入了一個更現(xiàn)實、也更殘酷的階段:不再只是“能跑模型”,而是必須經(jīng)得起真實場景、真實客戶和長期運行的檢驗。面對這種轉(zhuǎn)變,國產(chǎn)GPU廠商如何應(yīng)對,是衡量企業(yè)能否轉(zhuǎn)注下一波AI浪潮的的關(guān)鍵。

近日,本土首家GPGPU廠商天數(shù)智芯發(fā)布了公司面向未來的芯片架構(gòu)路線圖,最新邊端產(chǎn)品,以及公司在應(yīng)用和生態(tài)方面的布局,為助力中國人工智能邁向新階段做好充分準備。

公布四代架構(gòu),已超越Hopper

如果用一個詞來形容這些年人工智能對算力的要求,“性能”無疑是一個極具競爭力的候選。尤其是在大模型浪潮席卷全球之后,模型訓(xùn)練參數(shù)越來越巨大,如何打造越來越高性能的基礎(chǔ)設(shè)施就成為了所有從業(yè)者聚焦的重點。

換而言之,隨著大模型參數(shù)規(guī)模從百億邁向萬億級,數(shù)據(jù)中心的需求已不再只是增加 GPU 數(shù)量,而是全面升級為系統(tǒng)工程問題:單機柜算力密度快速提升,帶來更高的供電與散熱壓力;模型并行與分布式訓(xùn)練放大了對高速互連和低延遲網(wǎng)絡(luò)的依賴;長期高負載運行使 PUE、TCO 和穩(wěn)定性成為核心指標。也就是說,如何推動數(shù)據(jù)中心正在從“堆硬件”的算力工廠,轉(zhuǎn)向圍繞效率、可靠性和可持續(xù)性的綜合算力基礎(chǔ)設(shè)施,已經(jīng)成為了當下以未來的工作重點。

天數(shù)智芯AI與加速計算技術(shù)負責(zé)人單天逸也直言道,過去十年是算力野蠻增長的十年,規(guī)模的快速擴張確實帶來了階段性的產(chǎn)業(yè)繁榮。但繁榮背后,是難以忽視的效率困局。

“推理場景的平均利用率不足 20%,訓(xùn)練場景的平均利用率也僅在40%出頭,我們的理論算力一路飆升,可到了實際應(yīng)用場景里,效率卻大打折扣。這種粗放式發(fā)展,直接導(dǎo)致了能效比失衡、算力資源嚴重浪費的問題?!眴翁煲菖e例說。

有見及此,單天逸指出,擁有高效率、可預(yù)期以及可持續(xù)三個特征的高質(zhì)量算力勢在必行。

據(jù)介紹,所謂高效率,是指能為客戶創(chuàng)造最優(yōu)的 TCO,實實在在幫客戶節(jié)省使用成本;至于可預(yù)期,是指可以通過精準的仿真模擬,讓客戶在拿到芯片、部署算力之前,就能清晰預(yù)判最終的性能表現(xiàn),做到所見即所得;來到可持續(xù)方面,是指不但能支持現(xiàn)在主流的 CNN、RNN和 Transformer,還能支持和適配目前還未誕生的全新算法。“我們堅持聚焦通用算力,確保產(chǎn)品在長期周期內(nèi)仍能穩(wěn)定發(fā)揮算力價值”,單天逸總結(jié)說。

基于這個思考和定位,單天逸公布了天數(shù)智芯的四代架構(gòu)路線圖:2025年,天數(shù)天樞架構(gòu)在DeepSeek R3場景中實現(xiàn)性能超越英偉達Hopper 20%;2026年,天數(shù)天璇架構(gòu)對標Blackwell;2026年,天數(shù)天璣架構(gòu)超越Blackwell;2027年,天數(shù)天權(quán)架構(gòu)超越Rubin;2027年之后將轉(zhuǎn)向突破性計算芯片架構(gòu)設(shè)計。

為了實現(xiàn)高質(zhì)量算力的目標,天數(shù)智芯微天數(shù)天樞架構(gòu)引入了多項核心技術(shù)創(chuàng)新。其中,TPC BroadCast(計算組廣播機制) 設(shè)計通過上游數(shù)據(jù)廣播減少重復(fù)訪存,等效提升帶寬并降低功耗;Instruction Co-Exec(多指令并行處理系統(tǒng))設(shè)計實現(xiàn)多類型指令并行處理,增強復(fù)雜任務(wù)處理能力;Dynamic Warp Scheduling(動態(tài)線程組調(diào)度系統(tǒng))機制則通過動態(tài)調(diào)度避免資源爭搶,提升計算資源利用率。

面向未來的計算需求,天數(shù)智芯也為天數(shù)天樞架構(gòu)提供了從高精度科學(xué)計算到AI精度計算支持,能讓AI 芯片在執(zhí)行注意力機制相關(guān)計算時,算力的實際有效利用效率達到 90% 及以上;來到天數(shù)天璇架構(gòu),還將新增 ixFP4 精度支持。在天數(shù)天璣架構(gòu)和天數(shù)天權(quán)架構(gòu),天數(shù)智芯也將先后實現(xiàn)全場景AI與加速計算覆蓋并融入更多精度支持與創(chuàng)新設(shè)計。

基于這些架構(gòu),天數(shù)智芯為打造面向未來的算力打下了夯實的基礎(chǔ)。

端側(cè)產(chǎn)品“四劍”齊發(fā),

實現(xiàn)全場景布局

在上述的架構(gòu)加持下,天數(shù)智芯計劃在未來3年推出包括“天垓”和“智鎧”系列在內(nèi)的多款芯片,持續(xù)提升每瓦性能、每平方毫米性能極限,迭代核心計算單元、提高芯片效率,實現(xiàn)每代產(chǎn)品每塊錢token處理能力翻倍。而在芯片的持續(xù)迭代過程中,人工智能本身也在變化。

隨著 AI 形態(tài)從單次推理演進為以 Agent 為核心的持續(xù)運行體系,并進一步進入物理世界,算力需求的約束正在系統(tǒng)性改變——由集中式訓(xùn)練主導(dǎo)的峰值算力需求,轉(zhuǎn)向以高頻、多步、長時推理為特征的持續(xù)負載。與此同時,Physical AI 的落地推動大量推理任務(wù)向邊端和端側(cè)下沉,使邊端芯片的需求重心從“算得動”轉(zhuǎn)向“算得久、算得穩(wěn)、算得省”,對能效比、實時響應(yīng)和可靠性提出更高要求。

天數(shù)智芯副總裁郭為也認可道:“未來的應(yīng)用場景不僅需要會說話的AI,更需要會做事的AI,理解物理世界的規(guī)律,具備具身意識。換而言之,生成AI必然轉(zhuǎn)向物理AI。”正是因為有著這種共同的見解,天數(shù)智芯帶來了“彤央”系列邊端產(chǎn)品。按照郭為所說,這是AI和物理世界融合的媒介,這也是天數(shù)智芯實現(xiàn)“賦能邊端智慧,連接物理空間”愿景的重要依仗。

據(jù)介紹,此次發(fā)布的四款產(chǎn)品形態(tài)各異、各有側(cè)重。其中,彤央 TY1000 算力模組采用 699pin 接口,以口袋大小集成行業(yè)級算力與開放生態(tài),實現(xiàn)便攜化部署;彤央 TY1100 算力模組集成ARM v9 12核CPU 與自研GPU模組,以充沛算力提供多元選擇;彤央TY1100_NX 算力終端憑借更大顯存成為高性價比之選,堪稱邊端算力“小鋼炮”;彤央TY1200 算力終端則以 300TOPs 的極致性能與小巧身材,為 AIPC、具身智能等前沿場景提供核心支撐。

據(jù)透露,彤央全系列產(chǎn)品的標稱算力均為實測稠密算力,覆蓋 100T 到 300T 范圍。在計算機視覺、自然語言處理、DeepSeek 32B 大語言模型等多個場景的實測中,彤央 TY1000的性能全面優(yōu)于英偉達AGX Orin?!巴胂盗挟a(chǎn)品兼具高算力、成熟生態(tài)、靈活可拓展的核心優(yōu)勢,是連接AI與物理世界的最佳載體。我們的目標是成為國內(nèi)邊端大算力領(lǐng)域的領(lǐng)軍者”,郭為說。

隨著彤央系列的發(fā)布,天數(shù)智芯已經(jīng)有了覆蓋云端訓(xùn)練(天垓系列)、推理(智鎧系列)、邊端場景(彤央系列)的全棧式算力布局,讓公司可以提前卡位物理 AI 時代。而為了幫助開發(fā)者更好地利用公司的算力,天數(shù)智芯在軟件棧方面也火力全開。在招股說明書中,天數(shù)智芯就強調(diào),公司在提供多種通用GPU芯片及加速卡的同時,搭配自主開發(fā)的全棧軟件開發(fā)工具包(如驅(qū)動編譯器、性能優(yōu)化的函數(shù)庫、AI訓(xùn)練框架及推理引擎),從而實現(xiàn)訓(xùn)練及推理場景下強大的AI應(yīng)用。

“過去七年,天數(shù)始終以設(shè)計好用、可落地的產(chǎn)品為核心,在國際供應(yīng)鏈局勢劇烈變化的背景下,堅持從架構(gòu)核心IP到編譯器、驅(qū)動全自研,是國內(nèi)首家補全GPU全棧設(shè)計能力的企業(yè)?!碧鞌?shù)智芯副總裁鄒翾重申。“借助本次發(fā)布,我們實現(xiàn)了云端、邊緣側(cè)、端側(cè)全場景覆蓋,且全鏈路生態(tài)統(tǒng)一,同時兼容主流生態(tài)。目前國內(nèi)頭部GPU廠商中,天數(shù)智芯是唯一實現(xiàn)云邊端生態(tài)統(tǒng)一且全面兼容主流體系的企業(yè),這個完整方案是我們的重要優(yōu)勢。”郭為補充說。

從一份基于ByteMLPerf對天數(shù)智芯GPGPU芯片開展系統(tǒng)評測的報告中可以看到,天數(shù)智芯這種全棧的設(shè)計優(yōu)勢擁有極大的優(yōu)勢。

據(jù)介紹,通過采用 SIMT 架構(gòu),天數(shù)智芯在算子上實現(xiàn)了極高的硬件利用率;借助通算融合與流水線并行等“揚長避短”策略,天數(shù)智芯方案的吞吐量與首詞延遲在 DeepSeek R1 等大模型場景下的表現(xiàn)優(yōu)于 A800,這展現(xiàn)出深度的軟硬件協(xié)同優(yōu)化能力與強勁的國產(chǎn)算力實戰(zhàn)價值。(具體參考文章《ByteMLPerf 實測:天數(shù)智芯 GPGPU 全鏈路技術(shù)解析,創(chuàng)新釋放高效算力》)

集群穩(wěn)定運行千天,

爭當AI落地堅實底座

在與半導(dǎo)體行業(yè)觀察等溝通時候,天數(shù)智芯多次強調(diào),在當前的人工智能行業(yè),通用計算是一個明確的發(fā)展方向。而要成為這條賽道的重要賦能者,就需要回歸到通用計算的本質(zhì),支持所有種類的計算。天數(shù)智芯一直堅信:不要讓算力的僵化,限制算法的進化。硬件絕不應(yīng)該成為束縛算法探索的枷鎖,而要做孵化新算法的堅實底座。

正是在這種堅持的推動下,截止2025年年底,天數(shù)智芯在互聯(lián)網(wǎng)大模型研究、金融、醫(yī)療、交通等超過20個行業(yè)落地諸多應(yīng)用,與超1000家用戶共同探索算法演進,通過軟硬件協(xié)同優(yōu)化,使產(chǎn)品能力達到商業(yè)級別,陪伴300多家客戶進入量產(chǎn)階段。這些數(shù)據(jù)背后,是公司產(chǎn)品性能的最好證明。例如在科學(xué)探索領(lǐng)域,天數(shù)智芯已經(jīng)適配320種通用計算模型,單集群可并行數(shù)千卡科研任務(wù),穩(wěn)定運行1000多天,已落地國內(nèi)多家頂級學(xué)府。

除此以外,在互聯(lián)網(wǎng)AI領(lǐng)域,天數(shù)智芯實現(xiàn)了單機性能翻倍、Token成本減半、人力節(jié)省1/3;在大模型適配上,達成95%算子復(fù)用,可應(yīng)對NGS(下一代測序數(shù)據(jù)處理)處理等場景中算法繁雜、負載波動大的問題;金融領(lǐng)域,研報生成效率提升70%,量化分析響應(yīng)速度提升30%;醫(yī)療領(lǐng)域,結(jié)構(gòu)化病歷生成時間縮至 30 秒/份,腸胃鏡病灶定位精度提升30%;為各行業(yè)發(fā)展提供堅實AI算力支撐。在此期間,公司的營收在2022到2024 年間實現(xiàn)了 68.8%復(fù)合增長率,截至2025年6月30日,公司累計也交付逾 5.2 萬片通用 GPU 產(chǎn)品。

來到最新發(fā)布的彤央系列產(chǎn)品上,天數(shù)智芯也推動其落地大量應(yīng)用場景:具身智能領(lǐng)域,為格藍若機器人提供高算力、低延遲的“大腦”支撐;在工業(yè)智能領(lǐng)域,落地園區(qū)與產(chǎn)線,推動產(chǎn)線自動化升級;在商業(yè)智能領(lǐng)域,瑞幸咖啡數(shù)千家門店部署彤央方案,高效處理視頻流、挖掘消費數(shù)據(jù)價值;在交通智能領(lǐng)域,與“車路云一體化”20大頭部試點城市合作,驗證車路協(xié)同方案。

在鄒翾看來,AI驅(qū)動的算法與應(yīng)用浪潮已全面開啟,每個設(shè)計者既是貢獻者也是受益者。作為一個領(lǐng)先賦能者,天數(shù)智芯將一如既往地堅持高效率、可預(yù)期、可持續(xù)的架構(gòu)理念,持續(xù)打造高性能、高性價比、更好用的產(chǎn)品,提供穩(wěn)定可靠的算力底座,推動AI規(guī)?;涞?,寄望未來每位開發(fā)者都能通過簡單編程獲取觸手可及的算力,將創(chuàng)意轉(zhuǎn)化為推動人類進步的力量,實現(xiàn)算力普惠、創(chuàng)新無界。

“天數(shù)智芯堅定認為,生態(tài)決定開發(fā)成本、性能、應(yīng)用覆蓋率與用戶體驗,公司后續(xù)將持續(xù)加大生態(tài)投入,從應(yīng)用框架到模型庫、從開發(fā)工具到行業(yè)方案、從軟件棧到芯片優(yōu)化,與合作伙伴共同打磨面向未來的易用AI系統(tǒng),為用戶創(chuàng)造極致性能、最優(yōu)性價比與真正易用性三大核心價值?!编u翾補充說。

值得一提的是,依托 kv cache 量化 + 無損反量化的核心技術(shù)組合,天數(shù)智芯能讓模型推理中的實際內(nèi)存使用量直接降低 50% 以上,從底層大幅減少對高成本存儲資源的依賴;同時憑借自研 IX-SIMU 全棧軟件系統(tǒng),可實時適配存儲市場的動態(tài)價格變化,為客戶完成專業(yè)的硬件適配測算與組合選型,精準鎖定最具性價比的硬件搭配方案,讓客戶在價格波動的市場環(huán)境中,既實現(xiàn)推理性能的保障,又能最大化控制部署成本,達成 AI 推理落地的性能與成本最優(yōu)解。

在當前內(nèi)存價格高企給企業(yè)帶來巨大挑戰(zhàn)的當下,這再次體現(xiàn)了天數(shù)智芯方案的優(yōu)越性。

寫在最后

單天逸告訴半導(dǎo)體行業(yè)觀察:“與一家純芯片公司相比,天數(shù)智芯更傾向于將自己定位為解決方案提供商,幫客戶解決實際問題?!弊鳛橐患彝ㄓ肎PU供應(yīng)商,如上所述,這也是天數(shù)智芯一直在踐行的戰(zhàn)略。

但是,我們也必須承認,大模型大局依然未定,未來依然充滿很多可能,這就對算力有了不同的需求?;谶@個事實,天數(shù)智芯在堅持以通用計算為核心,確保產(chǎn)品適配更廣泛的場景與未來算法迭代之余。還兼顧定制化優(yōu)化,通過DSA等技術(shù)實現(xiàn)定制化需求落地。這和英偉達等業(yè)界領(lǐng)先廠商的做法不謀而合。

在談到未來展望時,單天逸表示,客戶對核心技術(shù)國產(chǎn)化的認可度在提升,這為公司創(chuàng)造了良好的合作基礎(chǔ)。公司在未來也先也將持續(xù)積累,堅持自主創(chuàng)新,尋找原創(chuàng)性突破的機會,力爭成為具備行業(yè)定義能力的企業(yè)。

“我們不追求成為‘第二個英偉達’,就像科比不想成為第二個喬丹,我們要走出自己的道路?!眴翁煲菡f。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 不卡欧美| 日韩精品一线二线三线 | 人人插人人看 | 国产毛片视频 | av撸撸在线| 四虎在线免费观看 | 国产精选视频 | 五月婷婷视频在线观看 | 视频一二三区 | 久久久天天 | 亚洲色图图片 | 免费在线观看一区二区三区 | 神马午夜视频 | 91精品国产欧美一区二区 | 午夜av在线播放 | 亚洲免费网站在线观看 | 亚洲精品成人av久久 | 伊人成综合网 | 亚洲国产精品视频 | 午夜视频在线免费观看 | 国产视频一区二区在线 | 中文字幕精品三区 | 狠狠干综合| 日韩午夜在线视频 | 国产精品mm | 日本黄色一级网站 | 天堂av资源在线 | 天天艹夜夜 | 美女网站在线看 | 欧美性猛交xxxx乱大交 | 精品国产自 | 青青草这里只有精品 | 亚洲在线视频一区二区 | 成人亚洲网 | 亚洲第四页 | 日韩影院一区二区 | 久热中文 | 天天射天天拍 | 日韩国产欧美一区二区三区 | 二级黄色片 | 亚洲成人精品 |