近日,人工智能領(lǐng)域迎來重要進(jìn)展,智譜公司正式發(fā)布其最新一代基礎(chǔ)模型GLM-5。這款擁有744B參數(shù)(40B激活)的模型,規(guī)模達(dá)到前代GLM-4.5的兩倍以上,在Artificial Analysis全球榜單中位列第四,同時摘得開源模型桂冠。技術(shù)報告顯示,GLM-5的預(yù)訓(xùn)練數(shù)據(jù)量從23T擴(kuò)展至28.5T,印證了規(guī)模化仍是提升AGI效能的核心路徑。
在編程能力方面,GLM-5展現(xiàn)出顯著突破。該模型在SWE-bench-Verified和Terminal Bench 2.0基準(zhǔn)測試中分別取得77.8和56.2的開源模型最高分,性能超越Gemini 3 Pro,并與Claude Opus 4.5形成直接對標(biāo)。架構(gòu)創(chuàng)新上,模型引入DeepSeek的DSA稀疏注意力機(jī)制,在保持上下文容量的同時降低30%部署成本。資本市場對此反應(yīng)積極,發(fā)布當(dāng)日智譜股價單日漲幅達(dá)26%,周累計漲幅近70%,市值突破1756億港幣。
實測環(huán)節(jié)驗證了GLM-5的邏輯推理能力。面對"100米距離選擇開車還是步行洗車"的經(jīng)典陷阱題,模型精準(zhǔn)指出核心矛盾:"需要清洗的是車輛而非人體",并創(chuàng)造性提出"駕車前往后步行返家,洗車完成后再取車"的優(yōu)化方案。在處理"父母能否結(jié)婚"的模糊問題時,模型自動拆解出"未婚父母"與"已婚父母"兩種場景,準(zhǔn)確識別出常規(guī)語境下的邏輯悖論。更令人印象深刻的是,當(dāng)被問及"親生父母結(jié)婚未通知自己"的情緒困擾時,模型瞬間切換至心理咨詢模式,同時敏銳捕捉到時間維度上的根本矛盾——新生兒不可能參與父母婚禮。
開發(fā)者社區(qū)的實戰(zhàn)測試進(jìn)一步印證模型實力。某開發(fā)者使用OpenClaw Agent進(jìn)行SwiftUI編程對比,GLM-5在界面布局與交互邏輯實現(xiàn)上優(yōu)于Minimax M2.1。另一組3D網(wǎng)頁開發(fā)測試中,GLM-5與Opus 4.6展現(xiàn)出不同設(shè)計風(fēng)格,但前者在工程實現(xiàn)完整性上獲得更高評價。這些案例表明,模型已具備從代碼生成向系統(tǒng)級工程能力躍遷的潛質(zhì)。
技術(shù)適配層面,GLM-5完成與華為昇騰、摩爾線程、寒武紀(jì)等七家國產(chǎn)算力平臺的深度優(yōu)化,通過底層算子重構(gòu)實現(xiàn)硬件加速,在國產(chǎn)芯片集群上達(dá)成高吞吐、低延遲的穩(wěn)定運行。服務(wù)模式上,智譜調(diào)整GLM Coding Plan套餐價格,最低漲幅30%,同時開放Hugging Face和魔搭社區(qū)的模型權(quán)重下載,支持Claude Code與OpenClaw生態(tài)兼容,普通用戶可通過Z.ai平臺免費體驗。
針對專業(yè)開發(fā)場景,智譜推出Z Code智能體開發(fā)環(huán)境。該系統(tǒng)可自動拆解用戶需求,調(diào)度多智能體并行完成代碼編寫、命令執(zhí)行、調(diào)試預(yù)覽等全流程開發(fā),甚至支持手機(jī)端遠(yuǎn)程操控桌面Agent。值得關(guān)注的是,Z Code平臺本身即由GLM系列模型參與構(gòu)建,形成技術(shù)閉環(huán)。在文檔處理領(lǐng)域,GLM-5突破傳統(tǒng)文本生成邊界,可直接輸出Word、PDF、Excel等格式文件,在Vending Bench 2模擬經(jīng)營測試中取得4432美元賬戶余額,展現(xiàn)出色的長期規(guī)劃能力。
技術(shù)革新背后是算法框架的突破。智譜研發(fā)的"Slime"強(qiáng)化學(xué)習(xí)架構(gòu)支持更大規(guī)模模型訓(xùn)練,配合異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠從長序列交互中持續(xù)學(xué)習(xí)。這種設(shè)計顯著提升了復(fù)雜任務(wù)執(zhí)行效率,在BrowseComp聯(lián)網(wǎng)檢索、MCP-Atlas工具調(diào)用等專項測試中均刷新開源模型紀(jì)錄。隨著工程化能力成為競爭焦點,大模型正從輔助開發(fā)工具向獨立承擔(dān)完整工程環(huán)節(jié)的方向演進(jìn)。











