近日,智譜與華為攜手宣布開源新一代圖像生成模型GLM-Image,這一成果標志著國產AI技術取得重要突破。該模型基于昇騰Atlas 800T A2硬件平臺與昇思MindSpore框架開發,實現了從數據預處理到模型訓練的全流程國產化,成為首個在國產芯片上完成完整訓練的多模態SOTA模型。
開源僅24小時內,GLM-Image便登頂全球知名AI開源社區Hugging Face的熱門榜單首位。這一成績不僅刷新了國產模型在國際開源社區的排名紀錄,更驗證了國產算力支撐大規模AI訓練的可行性,為國內AI生態建設提供了重要參考。
技術架構方面,GLM-Image突破傳統開源方案,采用"自回歸編碼+擴散解碼"的混合架構設計。這種創新結構在保持與主流方案兼容性的同時,顯著提升了知識密集型場景下的生成效果,尤其在復雜指令理解與長文本渲染方面表現突出。
在性能驗證環節,該模型在CVTG-2K復雜視覺文本生成和LongText-Bench長文本渲染兩項國際權威基準測試中均取得開源模型第一的成績。測試數據顯示,模型在漢字生成任務中展現出獨特優勢,能夠準確理解多層次語義指令,生成符合視覺規范的專業級內容。
據開發團隊介紹,GLM-Image項目聚焦全流程創新,是針對新一代"認知型生成"技術范式的探索實踐。通過與昇騰生態的深度適配,模型在訓練效率上達到硬件理論性能上限,為國產AI芯片在多模態領域的應用開辟了新路徑。
目前,GLM-Image已面向全球開發者開放完整代碼與模型權重,提供GitHub和Hugging Face雙平臺訪問通道。其開源內容包含訓練框架配置、數據預處理流程及推理部署方案,為行業提供了可復現的國產化技術方案。該模型在海報設計、PPT生成、科普可視化等知識密集型場景具有廣泛應用前景,相關技術文檔已同步發布至開源社區。











