滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

智譜GLM-5V-Turbo發布：視覺編程新突破，一眼識圖生成代碼

時間：2026-04-03 11:51:51 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

在開發領域，視覺信息占據著主導地位，超過80%的需求以視覺形式呈現。然而，許多國內代碼大模型長期以來只能依賴文本描述來推測頁面布局，難以直接處理視覺信息。近日，智譜推出的GLM-5V-Turbo模型打破了這一局限，為視覺編程帶來了新的突破。

GLM-5V-Turbo是一款專為視覺編程設計的多模態模型，能夠原生融合視覺與文本能力。它不再依賴文本轉譯來“猜測”世界，而是直接理解設計圖、解析復雜界面并生成對應代碼，實現了從視覺感知到代碼實現的完整開發鏈路。這一創新在海外社區引起了廣泛關注，主貼閱讀量迅速突破百萬。

該模型在推理速度和核心能力上均表現出色。在前端看重的Design2code評測中，GLM-5V-Turbo以92.6的高分超越了K2.5的91.3分，展現了其在視覺UI轉化為代碼方面的精準度。在多模態工具調用方面，它在BrowseComp-VL評測中取得了48.7的成績，領先于K2.5的42.9分，具備了“看圖找工具辦事”的實用能力。在Agent復雜任務評測中，其Pass3分數接近行業頂尖水平，顯示出強大的綜合規劃與執行力。

GLM-5V-Turbo的能力不僅限于單一圖像場景，還延伸至圖文混合理解與生成任務。例如，在處理斯坦福大學《2025年人工智能指數報告》時，該模型能夠提煉核心結論，并將其轉化為精美的多頁HTML演示文檔，同時生成結構化大綱JSON和Markdown格式的摘要。這一過程展示了模型在“閱讀—理解—抽象—表達—生成”多步流程中的卓越表現。

在更復雜的測試中，GLM-5V-Turbo被要求基于一張設計圖復刻一個完整的網頁。模型不僅實現了光標周圍清晰、其他位置模糊的視覺效果，還使網頁元素可點擊，并將特定文字改為打字機特效展示。網頁上的便利貼點擊后會展開記事本，不同窗口可展示圖片和視頻素材，初步效果令人驚艷。

GLM-5V-Turbo的技術優勢源于其獨特的模型架構和訓練方法。與大多數多模態模型“先語言后視覺”的工程化方法不同，該模型從預訓練階段就將文本和視覺信號深度融合。自研的CogViT視覺編碼器在通用物體識別、細粒度細節理解等方面顯著提升，配套的MTP結構則保證了推理效率。模型在強化學習階段同步優化超過30種任務，覆蓋STEM推理、視覺定位、視頻理解等領域，實現了能力的均衡提升。

為解決Agent領域高質量多模態交互數據稀缺的問題，智譜構建了分層數據體系，利用合成環境自動生成大規模可控數據，并通過過程獎勵模型（PRM）數據抑制幻覺生成。同時，模型工具鏈擴展至多模態搜索、區域框選標注等視覺交互類工具，將編程與任務執行的鏈路升級為“視覺-行動混合閉環”。

目前，GLM-5V-Turbo已開放API，Coding Plan用戶可申請搶先試用。開發者可通過BigModel開放平臺、AutoClaw（澳龍）和Z.ai等渠道訪問該模型。隨著API的開放和Agent生態的打通，智譜為開發者提供了“視覺感知+動作執行”的基礎設施，開啟了AI應用開發的新篇章。

更多>同類資訊

波司登高德康：五十年堅守與創新，引領中國品牌邁向高質量未來

“國潮熱的底色是品質，核心是創新，靈魂是文化”這一觀點，凝練了波司登五十年發展歷程的精髓，亦揭示了中國品牌在新時代的進取方向。他觀察到，消費市場正從“基本滿足”向“品質提升”轉型，情感價值與情緒價值已成為影響…

04-03

第二屆“數龍杯”啟幕在即，AI智能體賽道開啟，共赴創新盛宴！

除了各類AI游戲與AI應用以外，本屆大賽專門新增了AI智能體賽道，希望挖掘在這個領域真正有創造力、能解決實際問題的優秀項目。活動將聚焦AI應用落地、商業化路徑、大賽參賽賦能，邀請AI開發者、“數龍杯”潛在參賽…

04-03

ElevenLabs發布ElevenMusic，以“免費+訂閱”模式角逐AI音樂創作社交新賽道

04-03

關停Sora轉道收購TBPN，OpenAI從造工具到控渠道的“務實轉身”

04-03

零代碼低成本！我國首個物理AI個人平臺ORCA Lab 1.0發布，具身智能迎“普惠”新篇

04-03

OpenAI收購科技脫口秀TBPN：借力節目搭建AI公眾交流新橋梁

04-03

中廣聯演員委員會劃紅線：AI“偷臉”聲紋克隆遭嚴令禁止維權升級

04-03

魔法原子機器人科技申請“MAGICLAB PANDA”商標春晚限定“Magic Panda”受關注

04-03

上海交大攜手螞蟻健康共建“AI4HealthCare聯合實驗室” 賦能日常健康管理

04-03

國產AI發展迅猛：豆包大模型日均Token調用量飆升，應用落地加速

04-03

6G關鍵技術突破：從具身智能到低空經濟的多場景賦能之路

04-03

優必選1500萬起聘具身智能首席科學家，人形機器人業務營收大增

04-03

國科微倪亞宇：聚焦端側智能，以創新NPU與工具鏈賦能多元場景

04-03

開普勒機器人加速具身智能布局：以數據驅動賦能工業多場景應用

04-03

貨拉拉“老司機”形象上線：幽默靠譜又熱心，展現司機群體新風貌

04-03

點擊查看更多 +

全站最新

A股燃氣股全線下跌，長春燃氣跌7%

百度推醫生版“龍蝦”有醫助理醫療AI進階：算力數據安全成待闖關卡

A股異動丨工信部力推“算力銀行”，算力概念股普漲，思特奇漲超14%

貝康醫療：受精+囊胚培養液雙雙獲證，輔助生殖國產替代迎來“王者回歸”

沃爾沃EX60全球首發：以創新科技與環保理念，開啟智慧出行新篇章

硬派血統遇上科技巨頭！FREELANDER神行者Concept 97首發純電越野新勢力來襲

熱門內容

本欄最新

別克至境E7實車到店！大五座插混SUV 續航超長舒適配置拉滿

華為“克制”布局AI賽道：以硬件為基，聚焦核心，筑牢生態護城河

從“馬燈精神”到“東方風韻”：東風汽車以設計驅動駛向全球新航道

2026賽力斯汽車技術研討會在博鰲舉行聚智創新共繪高端智能汽車新藍圖

兩江新區霓星科技SC5X閃電版來襲，高性能智慧電摩開啟出行新體驗！

傅氏魔幻牽手瞳真科技入駐園區共筑文化科技融合新生態

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

智譜GLM-5V-Turbo發布：視覺編程新突破，一眼識圖生成代碼