近日,智譜與華為攜手推出新一代開源圖像生成模型GLM-Image,并宣布該模型已基于昇騰Atlas 800T A2服務器與昇思MindSpore AI框架完成全流程訓練與推理適配。這一成果標志著國產全棧算力體系首次成功支撐起前沿生成式模型的完整開發鏈路,為AI技術國產化落地提供了重要實踐樣本。
在技術架構層面,GLM-Image突破傳統LDM方案的局限,創新采用"自回歸編碼器+擴散解碼器"的混合架構設計。該模型通過自回歸機制實現全局語義理解,同時利用擴散模型強化局部細節生成能力,有效解決了知識密集型場景下的內容生成難題。尤其在中文文本渲染方面,模型展現出顯著優勢,能夠精準處理漢字結構、筆畫順序等復雜特征,在海報設計、PPT制作、科普插圖等應用場景中表現突出。
開源社區反響熱烈,模型上線不足24小時即登頂Hugging Face平臺全球熱度榜首位。性能測試數據顯示,在昇騰Atlas 800T A2集群上,GLM-Image的訓練效率達到硬件理論性能上限的92%,推理延遲控制在150ms以內。這一成果驗證了國產AI芯片與框架的協同優化能力,為構建自主可控的AI基礎設施提供了關鍵技術支撐。
據研發團隊介紹,GLM-Image的訓練過程實現了從數據預處理到模型部署的全鏈條國產化。通過動態圖模式與靜態圖模式的混合編程,團隊在昇思MindSpore框架上開發出自適應算子融合算法,使計算資源利用率提升40%。該模型目前已開放商業授權申請,支持教育、科研、文創等領域的應用開發,有望推動認知型生成模型在專業場景的深度應用。












