滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

新華三智解大模型推理難題：以創新方案突破顯存瓶頸，賦能AI高效落地

時間：2026-02-04 01:40:58 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

當前，全球核心存儲供應鏈正面臨前所未有的結構性短缺挑戰。權威機構預測，這一供需矛盾將持續至2027年，存儲部件價格大幅上漲已成定局。與此同時，生成式AI技術加速向規模化落地轉型，大模型應用場景從單一訓練向訓練推理并重發展，PD分離、KV Cache等創新技術雖提升了推理效率，卻對GPU內存的帶寬與容量提出了嚴苛要求。雙重壓力下，AI產業陷入資源緊缺與成本攀升的雙重困境，傳統硬件堆疊模式因成本高昂且受制于供應鏈產能，難以支撐產業可持續發展。

紫光股份旗下新華三集團針對這一行業痛點，推出大模型推理場景加速方案，通過軟硬件協同優化開辟新路徑。該方案核心在于自研定制化ASIC芯片的硬件級加速能力，可將KV Cache從GPU內存卸載至專用存儲節點，構建AI專屬的"下一代內存層"。這一創新架構顯著減輕GPU顯存壓力，實現存算資源動態平衡。經深度測試調優，新華三成功將前沿科技與自研AI服務器融合，形成性能與成本兼優的推理加速實踐，為行業提供全新解決方案。

在部署靈活性方面，該方案展現獨特優勢：既可通過單機形態直接提升單臺AI服務器推理性能，也能采用外置存儲節點模式實現多臺服務器集群加速。這種雙模式設計使其能夠適應不同規模企業的多樣化需求，從中小規模部署到大型數據中心均可靈活應用。

實測數據驗證了方案的有效性。基于自研高性能AI服務器的基準測試顯示，運行DeepSeek-V3-671B模型時，采用KV Cache卸載加速方案后，系統性能實現質的飛躍：在相同TPOT（每個Token生成的平均延遲）限制下，并發用戶數提升200%，首Token生成延遲（TTFT）降低70%，每個Token平均生成延遲（TPOT）降低30%。這些核心指標的優化直接轉化為用戶體驗的提升，使系統能夠同時服務更多用戶且響應更迅速。

該方案在應用場景適配性方面表現突出。針對交互式應用如智能客服、聊天機器人等需要多輪對話的場景，通過快速加載歷史KV Cache，系統響應延遲大幅縮短；在處理長文檔問答、代碼生成等需要數千Tokens上下文的任務時，PB級KV Cache擴展能力有效突破GPU內存容量瓶頸；對于高并發在線推理服務，優化的KV Cache管理機制使系統吞吐量（RPS）顯著提升，在相同GPU資源下可服務更多用戶。這些特性使其成為企業落地生成式AI應用的理想選擇。

新華三集團在AI領域的技術積累為此次突破奠定基礎。通過持續創新與實踐探索，公司不僅推出這款推理加速方案，更完成全流程調優驗證。隨著大模型規模擴大和用戶基數增長，推理效率已成為AI基礎設施性能的關鍵指標。新華三的解決方案通過優化資源利用效率，有效降低每token處理成本，為AI技術規模化應用掃清障礙，推動生成式AI在更多行業實現深度落地。

更多>同類資訊

Spotify借AI革新開發模式：頂尖開發者月余未寫代碼效率飆升

02-14

IBM 修改崗位描述，入門級員工將成為 AI 的“指揮官”

02-14

OpenAI發布GPT-5.3-Codex-Spark

02-14

AWS CEO稱AI對軟件行業的沖擊被夸大

02-14

2026直播電商新篇：謙尋深耕助農AI，系統化能力成競爭關鍵

02-14

春節人形機器人租賃熱潮涌動：流量生意興起，行業秩序待重整

02-14

螞蟻開源全球首個萬億參數混合線性思考模型，多項性能達開源領先

02-14

AI恐慌下軟件股遭錯殺？機構力挺：AI賦能市場擴容，估值修復在望

02-13

智能浪潮下人何去何從？《春潮·智啟新程》2月14日全網共尋答案

02-13

AI浪潮下IBM“逆流而上”：2026年美國入門級招聘規模計劃增至三倍

02-13

Spotify借助AI革新開發模式：頂尖開發者“停筆”，開發部署效率飆升

02-13

加速進化2025成績斐然：簽單破億現金流轉正，新春邀員工帶機器人回家

2026年2月11日南方小年，加速進化創始人、CEO程昊向全員發布新春內部信，回顧2025年核心突破，明確企業長期發展理念，并推出新春員工福利。信中披露，2025年加速進化人形機器人全球簽單超千臺、金額破億…

02-13

清華大學戴瓊海團隊攻克3D打印難題，0.6秒實現毫米級結構快速精準打印

記者12日從清華大學獲悉，該校戴瓊海院士團隊歷時5年攻關研發的計算全息光場（DISH）三維打印技術，突破傳統3D打印速度與精度的核心矛盾，將毫米尺寸復雜結構的曝光打印時間壓縮至0.6秒，創下體積3D打印領域新…

02-13

T48次列車“春晚”暖心上演仿生機器人亮相添彩科技年味共歡騰

2月13日，在黑龍江齊齊哈爾開往北京的T48次列車上，哈爾濱鐵路部門連續二十年舉辦的列車“春晚”如約而至。在多樣的節目中，兩個仿生機器人成為全場焦點，旅客沉浸在列車“春晚”溫馨氛圍的同時，也感受到了年味中滿滿…

02-13

新春探訪機器人6S店：技術員巧手調試，讓科技年味別樣濃

機器人寫出的“福”字，看似簡單的動作，卻源于這家機器人6S店的“服務機器人應用技術員”無數的數據訓練和反復參數調試。跟隨機器人6S店服務機器人應用技術員的腳步，記者來到機器人場景體驗館、互動體驗館。服務…

02-13

點擊查看更多 +

全站最新

石頭科技2月12日融資動態：融資凈賣出943萬融券凈買入1539股余額7.98億

沃爾沃SPA3平臺突破設計局限低底盤純電轎車與旅行車或將“復活”

魏建軍再發聲確認合作進展長城與FF攜手開拓北美市場迎新突破

比亞迪宋PLUS：以硬核實力鑄就銷量傳奇，引領中國新能源SUV新風潮

沃爾沃SPA3平臺突破傳統束縛低底盤純電轎車與旅行車或迎“新生”

智電時代穩健前行，一汽豐田以多元布局與創新驅動開啟新征程

熱門內容

本欄最新

馬年汽車業新征程：以“和光同塵”之姿破局前行謀發展

宇樹王興興：具身智能正爬坡，未來一兩年或迎拐點熱度遠超互聯網

賈躍亭再啟新程：FF攜手保定伙伴，FX車型量產能否成救命稻草？

東營科技館汽車主題展免費開放！邀您共赴百年科技變遷探索之旅

北汽元境入局AI賽道：務實布局下，能否助北汽新能源破局突圍？

深圳美格智能成功過會港交所，無線通信模組領域“小巨人”再啟新程

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

新華三智解大模型推理難題：以創新方案突破顯存瓶頸，賦能AI高效落地