近日,智譜AI與華為聯(lián)合宣布開源新一代圖像生成大模型 GLM-Image,該模型不僅在性能上達(dá)到當(dāng)前國際領(lǐng)先水平(SOTA),更創(chuàng)下一項關(guān)鍵紀(jì)錄:全球首個從數(shù)據(jù)處理、訓(xùn)練到推理全流程均基于國產(chǎn)AI芯片完成的多模態(tài)大模型。
據(jù)悉,GLM-Image全程依托華為昇騰Atlas800T A2服務(wù)器與昇思MindSpore AI框架構(gòu)建,徹底擺脫對國外GPU及深度學(xué)習(xí)框架的依賴,驗證了國產(chǎn)軟硬件棧支撐尖端AI研發(fā)的可行性與成熟度。
技術(shù)層面,GLM-Image采用智譜自主研發(fā)的 “自回歸+擴(kuò)散解碼器”混合架構(gòu),巧妙融合語言建模的邏輯連貫性與擴(kuò)散模型的高保真生成能力。這一設(shè)計使其不僅能根據(jù)文本精準(zhǔn)生成高質(zhì)量圖像,還能實現(xiàn)圖文語義的深度對齊與聯(lián)合推理,為“認(rèn)知型生成”(Cognitive Generation)這一新興范式提供核心引擎。該技術(shù)路線正被應(yīng)用于以Nano Banana Pro為代表的下一代AI創(chuàng)作平臺,推動AIGC從“像素堆砌”邁向“語義驅(qū)動”。
此次合作標(biāo)志著國產(chǎn)AI生態(tài)正從“可用”走向“好用”。過去,高性能多模態(tài)模型幾乎全部依賴英偉達(dá)GPU與PyTorch/TensorFlow生態(tài);如今,GLM-Image的成功訓(xùn)練證明,基于昇騰+MindSpore的全棧國產(chǎn)方案已具備支撐前沿科研與產(chǎn)業(yè)落地的能力。
在中美科技競爭加劇、算力自主可控成為國家戰(zhàn)略的背景下,GLM-Image的發(fā)布不僅是一次技術(shù)成果展示,更是中國AI產(chǎn)業(yè)鏈協(xié)同創(chuàng)新的關(guān)鍵一步。隨著更多開發(fā)者基于該模型進(jìn)行微調(diào)與應(yīng)用開發(fā),一個真正自主、開放、高性能的中文多模態(tài)生態(tài)有望加速成型。
項目地址:https://github.com/zai-org/GLM-Image











