國內(nèi)AI領(lǐng)域迎來重要突破——智譜公司宣布,其自主研發(fā)的GLM-Image多模態(tài)模型在國產(chǎn)芯片上完成全流程訓(xùn)練,并在開源后迅速登頂全球知名AI開源社區(qū)Hugging Face的Trending榜單首位。這一成果標志著國產(chǎn)AI模型在端到端自主研發(fā)能力上實現(xiàn)國際競爭新突破。
據(jù)介紹,GLM-Image基于華為昇騰Atlas 800T A2訓(xùn)練設(shè)備和昇思MindSpore AI框架開發(fā),實現(xiàn)了從訓(xùn)練到推理的全流程適配。該設(shè)備搭載鯤鵬920處理器與昇騰910 AI芯片,專為大規(guī)模AI訓(xùn)練場景設(shè)計,而昇思MindSpore作為華為開源的全場景AI框架,為模型開發(fā)提供了技術(shù)支撐。智譜團隊通過優(yōu)化算法架構(gòu),使模型訓(xùn)練性能達到設(shè)備理論性能上限,驗證了國產(chǎn)算力支撐前沿AI模型研發(fā)的可行性。
在性能表現(xiàn)上,GLM-Image在CVTG-2K復(fù)雜視覺文本生成榜單和LongText-Bench長文本渲染榜單中均位列開源模型第一。該模型具備精準理解指令的能力,尤其在漢字生成任務(wù)中表現(xiàn)突出,可精準處理海報設(shè)計、PPT制作、科普圖繪制等知識密集型場景的圖文生成需求。例如,在生成包含專業(yè)術(shù)語的科普圖表時,模型能同時保證文字準確性與視覺呈現(xiàn)效果。
目前,用戶可通過智譜清言APP或網(wǎng)頁版免費體驗GLM-Image功能。進入"AI畫圖"智能體后,在界面左下角選擇該模型即可使用。這一開放策略將推動國產(chǎn)多模態(tài)技術(shù)在更廣泛場景中的應(yīng)用,為內(nèi)容創(chuàng)作者、教育工作者等專業(yè)群體提供高效工具。
業(yè)內(nèi)專家指出,此次突破不僅證明國產(chǎn)硬件生態(tài)具備支撐國際領(lǐng)先AI模型研發(fā)的能力,更通過開源模式為全球開發(fā)者提供新選擇。隨著國產(chǎn)AI基礎(chǔ)設(shè)施的持續(xù)完善,中國在人工智能領(lǐng)域的技術(shù)自主性將進一步增強。











