滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

GLM-5架構揭秘：借力DeepSeek技術，國產大模型開啟效率新征程

時間：2026-02-12 00:48:59 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

距離春節僅剩數日，國產人工智能領域正醞釀新一輪技術浪潮。近期，多個技術平臺相繼披露智譜新模型GLM-5的研發進展，引發行業對春節前國產AI突破的期待。此前Kimi K2.5與Minimax M2.2的預熱動作已點燃市場熱情，而GLM-5的曝光路徑更顯獨特——48小時內三大技術社區形成完整信息鏈，揭示其技術演進方向。

2月7日，OpenRouter平臺悄然上線代號"pony-alpha"的模型，其思維鏈特征與智譜GLM系列高度相似。技術團隊發現，該模型在處理常規問題時以"嗯，......"作為思考起點，知識檢索任務采用分點羅列格式，代碼生成任務則明確標注用戶需求。實測顯示，其在貪吃蛇游戲和Minecraft模組開發等復雜代碼場景中表現穩定，但暫不支持圖像等多模態輸入。

技術線索在2月9日集中爆發。vLLM推理框架倉庫出現編號34124的代碼合并請求，首次明確出現"GLM-5"標識。代碼分析表明，該模型采用DeepSeek-V3系列驗證的稀疏注意力機制（DSA），并集成多標記預測（MTP）技術。同日，Hugging Face transformers倉庫合并的43858號請求，正式引入智譜設計的GlmMoeDsa架構。

架構細節顯示，GLM-5采用78層Transformer解碼器，前三層為稠密結構確保基礎語言理解能力，第四層起部署混合專家（MoE）架構。該模型配置256個專家網絡，單token處理激活8個專家及1個共享專家，參數調用比例控制在3%左右。上下文窗口擴展至202K，詞表規模達154,880，但相比前代提升幅度有限。

技術選型凸顯效率優先導向。MoE架構通過專業化分工降低計算成本，稠密前層設計避免稀疏化導致的表征斷裂風險。DSA機制借鑒DeepSeek開源方案，通過輕量級索引器篩選相關詞匯，使128K上下文場景計算量減少98%。MTP技術則突破傳統自回歸模式，在代碼生成等結構化任務中實現2-3倍的token生成速度提升。

行業觀察指出，GLM-5的技術路徑反映國產大模型研發范式轉變。通過集成開源技術優化而非完全自研，智譜在控制研發成本的同時，快速獲得經過驗證的解決方案。這種"站在巨人肩膀上"的策略，使模型在代碼生成和邏輯推理領域形成差異化優勢，尤其在軟件開發輔助場景具備競爭力。

但技術短板同樣明顯。缺乏多模態處理能力限制了其在AIGC創作領域的應用，在當前視覺語言融合成為主流的背景下，這一缺陷可能影響市場接受度。值得注意的是，GLM-5的技術脈絡中頻繁出現DeepSeek的技術印記，顯示開源生態對國產模型演進的重要影響。

隨著春節臨近，行業關注焦點已從參數規模轉向推理效率。GLM-5的架構設計表明，如何在有限計算資源下提升垂直領域表現，將成為下一階段競爭的關鍵。這場由開源技術驅動的效率革命，正在重塑國產大模型的發展軌跡。

更多>同類資訊

俄新型地面望遠鏡將啟用，3.12米主鏡助力精準追蹤3500公里太空垃圾

02-12

哈趣K3 Ultra Max投影儀：小戶型與租房黨的沉浸式影音福音

除了亮度表現令人滿意，哈趣K3 Ultra Max還帶來了更清晰銳利的畫面表現，擁有原生真1080P分辨率。目前哈趣K3 UltraMax已經全面接入三大AI智能體（DeepSeek、豆包、通義千問等）…

02-12

2026年單片機與物聯網定制開發優質供應商榜單，這些廠家值得關注！

具體測評依據及每個評分項占比為：技術實力占比 30%，主要考察廠家擁有的核心技術、研發能力以及技術創新成果等；合作案例占比25%，查看其過往合作項目的規模、難度以及涉及的行業領域；服務質量占比 20%，包…

02-12

6G浪潮奔涌向前中國電信以創新驅動拓展產業新生態

從社會應用價值來看，6G技術實現偏遠地區、海洋、極地、空中等地面網絡難以覆蓋區域的通信保障，同時，6G與AI、大數據、云計算、物聯網等技術的深度融合，將推動各領域的智能化升級，提升社會治理效能。在北京，中…

02-12

得一微電子：2025戰略升級智能汽車工業多領域突破 2026再啟新程

公司將以AI-MemoryX技術為基礎，深化面向智算中心的解決方案布局：通過高可靠的BGASSD面向DPU、GPU的啟動場景，同時推出傳輸速率高達14.5GB/s的新一代PCIe 5.0存力主控芯片，滿足端…

02-11

極智嘉Gino1亮相：專為倉儲設計，多任務操作引領行業智能化跨越

據IT之家了解，機器人頭部具備三目主視覺和前后魚眼相機，兼顧近景高精度識別和前后 360度環境感知和語義理解，為多任務復雜作業提供準確性和安全性保障。同時全關節力控，可實現與人與環境的安全作業，雙臂最大 …

02-11

蘋果積極談判應對內存漲價 2026年iPhone 18 Pro系列或維持原價

【環球網科技綜合報道】2月11日消息，據appleinsider報道稱，盡管全球內存價格持續上漲，蘋果公司正通過供應鏈優化與成本管控策略，力爭在2026年秋季發布的iPhone 18 Pro 和 iPho…

02-11

別克至境E7實車曝光，智能插混+超長續航，20萬級SUV市場新選擇

02-11

春節返鄉潮來襲，江蘇多舉措保障新能源車充電“一路暢行”

02-11

中國電科再傳捷報：兩款新型芯片流片成功助力自主算力體系構建

02-11

阿維塔AVATR.OS5.0.0推送：MoLA大模型助力，智駕座艙全面升級迎新篇

02-11

千問App持續發力：日活用戶超7352萬，6天穩居App Store免費榜首

02-11

科技豪華雙驅動騰勢D9三年銷冠重塑全球高端MPV新格局

02-11

臺積電批準發放2061億新臺幣獎金業績激勵與利潤分紅雙管齊下

02-11

智駕座艙雙進化！阿維塔 AVATR.OS 5.0 正式推送：MoLA 大模型上車，首批直達華為 ADS 4.1

02-11

點擊查看更多 +

全站最新

初代小米SU7交付超38.1萬輛收官，新一代SU7升級亮相并開啟多城展示

小米SU7交付量破38.1萬輛，新一代開啟預訂，價格配置升級有何看點？

特朗普大贊非農數據，再催美聯儲降息至“全球最低”

麥格理：首予文遠知行"跑贏大市"評級，目標價46港元/17.5美元

科大訊飛回應合作傳聞：AI語音技術多領域開花，生態構建迎新機遇與挑戰

不追風口深耕價值，科大訊飛憑務實與創新書寫AI企業長遠發展新答卷

熱門內容

本欄最新

別克至境E7實車曝光，智能插混+超長續航，20萬級SUV市場新選擇

春節返鄉潮來襲，江蘇多舉措保障新能源車充電“一路暢行”

科技豪華雙驅動騰勢D9三年銷冠重塑全球高端MPV新格局

長城魏牌V9X來襲！近5米3大身軀，2.0T插混續航超千公里，實力幾何？

央視聚焦東風汽車：以創新智造引領，驅動中國汽車產業穩健邁向新征程

閔行新春沙龍：網絡創作者共探優質內容創作，共繪閔行發展新畫卷

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

GLM-5架構揭秘：借力DeepSeek技術，國產大模型開啟效率新征程