國(guó)產(chǎn)人工智能大模型領(lǐng)域迎來(lái)新一輪技術(shù)突破。智譜科技正式發(fā)布新一代旗艦?zāi)P虶LM-5,在編程能力與智能體技術(shù)方面實(shí)現(xiàn)顯著提升,成為春節(jié)期間國(guó)產(chǎn)AI大模型競(jìng)爭(zhēng)的重要里程碑。該模型參數(shù)規(guī)模擴(kuò)展至7440億,激活參數(shù)達(dá)400億,較前代模型實(shí)現(xiàn)翻倍增長(zhǎng),預(yù)訓(xùn)練數(shù)據(jù)量同步提升至28.5TB。
技術(shù)架構(gòu)層面,GLM-5采用78層隱藏層設(shè)計(jì),集成256個(gè)專(zhuān)家模塊的混合架構(gòu),每次激活8個(gè)專(zhuān)家模塊實(shí)現(xiàn)動(dòng)態(tài)計(jì)算。模型創(chuàng)新引入DeepSeek稀疏注意力機(jī)制,在保持202K token長(zhǎng)文本處理能力的同時(shí),將部署成本降低30%,token利用效率提升25%。這種技術(shù)路線(xiàn)與DeepSeek-V3系列保持戰(zhàn)略協(xié)同,標(biāo)志著國(guó)產(chǎn)大模型在架構(gòu)優(yōu)化方面形成獨(dú)特路徑。
編程能力測(cè)試顯示,GLM-5在前端開(kāi)發(fā)、后端架構(gòu)及長(zhǎng)程任務(wù)處理等場(chǎng)景中,較前代模型性能提升超20%。在自主規(guī)劃執(zhí)行方面,該模型可獨(dú)立完成復(fù)雜系統(tǒng)重構(gòu)、深度調(diào)試等工程任務(wù),在真實(shí)開(kāi)發(fā)環(huán)境中的交互體驗(yàn)已接近國(guó)際領(lǐng)先水平。智譜科技特別強(qiáng)調(diào),模型在Claude Code評(píng)估集中的表現(xiàn)證明其具備替代專(zhuān)業(yè)開(kāi)發(fā)工具的潛力。
智能體技術(shù)成為GLM-5的核心突破點(diǎn)。在BrowseComp聯(lián)網(wǎng)檢索、MCP-Atlas工具調(diào)用及τ2-Bench自動(dòng)規(guī)劃三項(xiàng)權(quán)威基準(zhǔn)測(cè)試中,該模型均取得開(kāi)源領(lǐng)域最優(yōu)成績(jī)。這得益于全新研發(fā)的"Slime"訓(xùn)練框架,該框架支持超大規(guī)模模型的高效強(qiáng)化學(xué)習(xí),使后訓(xùn)練階段效率提升40%。配套提出的異步強(qiáng)化學(xué)習(xí)算法,使模型具備從長(zhǎng)周期交互中持續(xù)優(yōu)化的能力。
春節(jié)期間國(guó)產(chǎn)AI領(lǐng)域呈現(xiàn)集中爆發(fā)態(tài)勢(shì)。就在GLM-5發(fā)布同日,Minimax公司推出2.5版本模型,距離前代發(fā)布僅隔38天。此前DeepSeek、阿里千問(wèn)Qwen 3.5、字節(jié)跳動(dòng)SeeDance 2.0等模型已相繼亮相,形成技術(shù)迭代的集群效應(yīng)。這種密集發(fā)布節(jié)奏反映出國(guó)內(nèi)廠(chǎng)商在算力儲(chǔ)備、數(shù)據(jù)積累和工程化能力方面的全面進(jìn)步。
目前GLM-5已通過(guò)chat.z.ai平臺(tái)開(kāi)放測(cè)試,但完整技術(shù)文檔尚未公開(kāi)。行業(yè)觀(guān)察人士指出,雖然參數(shù)規(guī)模和基準(zhǔn)測(cè)試成績(jī)顯著提升,但實(shí)際工程應(yīng)用中的穩(wěn)定性、多模態(tài)交互能力等維度仍需持續(xù)驗(yàn)證。隨著頭部廠(chǎng)商陸續(xù)公布技術(shù)細(xì)節(jié),國(guó)產(chǎn)大模型將進(jìn)入更激烈的技術(shù)比拼階段,開(kāi)發(fā)者社區(qū)的反饋將成為衡量模型實(shí)用價(jià)值的關(guān)鍵指標(biāo)。











