2月10日消息,前幾天我們提到春節期間國產AI行業會有幾款重磅產品推出,除了最受關注的DeepSeek V4之外,智譜的新一代大模型GLM-5也要上線了,推動該公司股價近期大漲200%。
前幾天在全球模型服務平臺OpenRouter上線了一款代號為“Pony Alpha”的匿名模型,引起了全球關注,因為它的表現很不錯,尤其是在寫代碼方面被認為能達到Claude Opus一個級別。
Pony Alpha到底是哪家的模型一度引發網友熱烈討論,目前幾乎可以確定是智譜的GLM-5了,一方面是系統的提示詞顯示它說自己是GLM,另一方面網友驗證了一個GLM大模型家族的特色bug,那就是輸入 “鍋內倒入植物油燒熱” 得到的答案是亂七八糟的,Pony Alpha也符合這個特點。
隨著更多信息的挖掘出來,GLM-5的技術架構也差不多明確了,它采用了與DeepSeek-V3/V3.2相同的技術路線——DeepSeek稀疏注意力,簡稱DSA,總參數量達745B,是上一代GLM-4.7的2倍。
除了DSA之外,GLM-5另一大技術特色是多Token預測(Multi-Token Prediction,MTP),有78層隱藏層,256個專家,每次激活8個,激活參數約44B,稀疏度5.9%,上下文窗口最高支持202K token。
復用DS架構的好處有很多,可以直接受益于vLLM、SGLang等主流推理框架的現有優化,部署門檻將大幅降低。
不過值得關注的是GLM-5的多模態能力,因為DS此前還是文本大模型,不支持視頻的,而多模態能力在2026年是新一代大模型不應該缺少的能力。
隨著GLM大模型在海內外受到歡迎,智譜公司股價近期也一路上漲,總市值已經到了1500億港幣左右,是數月前IPO上市時的3倍。(憲瑞)










