人工智能領域迎來重要進展,智譜公司正式發布并開源其最新模型GLM-5。該模型在國際權威評測平臺Artificial Analysis的榜單中表現亮眼,位列全球第四,同時在開源模型中排名第一,標志著我國在智能體工程領域取得突破性成果。
據技術團隊介紹,GLM-5實現了從代碼生成到系統化工程思維的跨越式發展。相較于傳統模型專注于代碼片段生成,新模型構建了完整的Agentic Engineering框架,能夠深度理解復雜工程邏輯,在多步驟任務規劃、工具鏈協同等場景中展現顯著優勢。這種進化使得模型在處理真實開發需求時更具實用價值。
在多項基準測試中,GLM-5展現出卓越性能。編程能力測試方面,該模型在SWE-bench-Verified和Terminal Bench 2.0分別取得77.8和56.2的開源模型最高分,超越Gemini 3 Pro等國際主流模型。在涉及聯網檢索、工具調用等綜合能力的BrowseComp、MCP-Atlas測試中,同樣占據開源模型首位。復雜場景測試中,τ2-Bench和Vending Bench 2的評估結果也驗證了其領先地位。
國產化適配成為該模型的重要特色。研發團隊與華為昇騰、摩爾線程、寒武紀等七家國內算力供應商展開深度合作,完成從芯片架構到推理框架的全面優化。這種適配能力確保模型可在不同技術路線的國產硬件上高效運行,為金融、制造、能源等關鍵領域的自主可控應用提供技術支撐。
技術文檔顯示,GLM-5采用混合架構設計,在保持參數規模可控的同時,通過動態注意力機制提升長文本處理能力。其訓練數據覆蓋多語言編程規范、工程文檔和實時網絡信息,使得模型既能生成符合編碼規范的代碼,又能理解業務場景中的非結構化需求。這種設計理念有效解決了傳統模型"重生成輕理解"的缺陷。
開源社區對GLM-5的發布反應熱烈。開發者指出,該模型提供的工程化接口和預訓練模塊顯著降低了智能體開發門檻。特別是在需要多工具協同的復雜場景中,模型自帶的規劃執行框架可減少60%以上的代碼量。目前已有多個開源項目基于GLM-5構建自動化運維、智能客服等應用原型。












