滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

智譜創(chuàng)始人唐杰：2026年AI for Science迎爆發(fā)，智譜專注創(chuàng)新謀突破

時間：2026-01-11 12:12:15 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

近期，大模型領(lǐng)域發(fā)展勢頭迅猛，智譜AI與minimax相繼完成上市，月之暗面KIMI也成功獲得5億美元融資，整個行業(yè)正從概念階段加速邁向商業(yè)化落地。

在智譜AI成功上市后，其創(chuàng)始人、清華大學(xué)教授唐杰發(fā)表了一場公開演講。他指出，2026年極有可能成為AI for Science的爆發(fā)之年，隨著各項(xiàng)能力的顯著提升，眾多領(lǐng)域?qū)⒂瓉硇碌陌l(fā)展契機(jī)。

唐杰詳細(xì)闡述了智譜AI在2026年的重點(diǎn)規(guī)劃。首先，在Scaling方面將持續(xù)推進(jìn)，不斷擴(kuò)充數(shù)據(jù)規(guī)模，探索模型性能的上限，同時積極探索未知的新范式。其次，技術(shù)創(chuàng)新是關(guān)鍵，公司將致力于全新的模型架構(gòu)研發(fā)，著力解決超長上下文處理、高效知識壓縮等難題，并實(shí)現(xiàn)知識記憶與持續(xù)學(xué)習(xí)功能，為模型賦予更強(qiáng)大的能力。多模態(tài)感統(tǒng)能力將成為今年的熱點(diǎn)與重點(diǎn)，這一能力的突破將使AI能夠勝任機(jī)器中的長任務(wù)、長時效任務(wù)，進(jìn)而在人類的工作環(huán)境中發(fā)揮作用，助力AI實(shí)現(xiàn)具身智能，真正融入物理世界。

唐杰回顧了自己的科研歷程，自2006年從清華大學(xué)畢業(yè)后的20年里，他主要專注于兩件事：一是開發(fā)AMiner系統(tǒng)，二是投身于大模型研究。他以“像喝咖啡一樣上癮”的精神投身科研，這種專注與堅持促使他抓住了AGI這一長期投入領(lǐng)域的機(jī)遇。

智譜AI實(shí)驗(yàn)室在2019年做出了重大戰(zhàn)略調(diào)整，暫停了當(dāng)時在國際上表現(xiàn)不錯的圖神經(jīng)網(wǎng)絡(luò)和知識圖譜研究方向，全體人員轉(zhuǎn)向大模型研究。經(jīng)過多年的努力，取得了顯著成果。從大模型智能水平的發(fā)展歷程來看，2020年時模型僅能處理一些簡單的MMU和QA問題，到2021 - 2022年已能夠完成數(shù)學(xué)推理題，再到2023 - 2024年可以處理研究生水平的復(fù)雜問題，甚至在真實(shí)世界的編程問題上也表現(xiàn)出色，智能水平不斷提升，如同人類成長一般逐步積累知識、提升能力。

在提升模型泛化能力方面，唐杰表示，目前主要通過Scaling來實(shí)現(xiàn)，但模型的泛化能力仍有待提高。早期通過Transformer訓(xùn)練模型，數(shù)據(jù)和算力的增加提升了長時知識記憶能力，但泛化能力有限。后來通過對齊和推理，利用持續(xù)的Scaling SFT和強(qiáng)化學(xué)習(xí)，尤其是今年可驗(yàn)證獎勵強(qiáng)化學(xué)習(xí)（RLVR）的爆發(fā)，使模型能夠通過可驗(yàn)證環(huán)境自主探索反饋數(shù)據(jù)，實(shí)現(xiàn)自我成長。然而，RLVR也面臨挑戰(zhàn)，如可驗(yàn)證場景的局限性，如何拓展到半自動或不可驗(yàn)證場景，實(shí)現(xiàn)模型的通用化，是亟待解決的問題。同時，未來機(jī)器將在物理世界承擔(dān)真實(shí)任務(wù)，構(gòu)建智能體環(huán)境也面臨諸多挑戰(zhàn)。

2025年初，DeepSeek的出現(xiàn)給研究界和產(chǎn)業(yè)界帶來了巨大沖擊，其性能強(qiáng)大，令人震撼。唐杰認(rèn)為，在DeepSeek的范式下，Chat時代的問題可能已基本得到解決，未來AI的發(fā)展將開啟新范式，即讓每個人能夠運(yùn)用AI完成實(shí)際任務(wù)。在這一選擇上，智譜AI選擇了賦予模型Thinking能力，并整合Coding、Agentic、Reasoning能力，于2025年7月28日發(fā)布了4.5版本，在智能體、推理、代碼等多個Benchmark上取得了優(yōu)異成績。但該版本在實(shí)際編程場景中也暴露出一些問題，如無法完成復(fù)雜的“植物大戰(zhàn)僵尸”編程任務(wù)，這促使公司利用RLVR可驗(yàn)證的強(qiáng)化學(xué)習(xí)環(huán)境，結(jié)合編程環(huán)境反饋和SFT數(shù)據(jù)，提升了模型效果。

在Web能力開發(fā)方面，智譜AI也取得了一定進(jìn)展，通過可驗(yàn)證環(huán)境提升了模型在SWE Bench上的得分。然而，將模型能力整合到主模型仍面臨挑戰(zhàn)，真實(shí)用戶體驗(yàn)與跑分結(jié)果可能存在差異。為此，公司開發(fā)了全異步的訓(xùn)練強(qiáng)化學(xué)習(xí)框架，統(tǒng)一訓(xùn)練大量RL任務(wù)，提升了Agent和Coding能力，最新發(fā)布的4.7版本在相關(guān)方面有了顯著提升。在真實(shí)場景評測中，公司邀請眾多編程高手進(jìn)行人工評測，但仍有許多問題有待解決。

在構(gòu)建Coding Agent環(huán)境方面，智譜AI基于Github數(shù)據(jù)實(shí)現(xiàn)了自動化構(gòu)建，但將大量RL任務(wù)統(tǒng)一訓(xùn)練也面臨任務(wù)長度和時間不同的難題。公司開源的全異步訓(xùn)練強(qiáng)化學(xué)習(xí)框架解決了這一問題，提升了Agent和Coding能力。同時，在讓AI完成復(fù)雜任務(wù)方面，如監(jiān)控小紅書并整理相關(guān)討論生成文檔，需要將API與GUI混合使用，通過抽取大量數(shù)據(jù)并進(jìn)行全異步強(qiáng)化學(xué)習(xí)，賦予AI一定的泛化能力。為克服冷啟動問題，公司采用SFT與強(qiáng)化學(xué)習(xí)交替的訓(xùn)練算法，提升了模型在移動環(huán)境下的效果，并在多任務(wù)大模型強(qiáng)調(diào)學(xué)習(xí)上開展了相關(guān)工作。

2025年12月，智譜AI開源了AutoGLM 9B模型，該模型在人機(jī)交互中執(zhí)行速度快，開源后迅速獲得了大量關(guān)注。以旅行規(guī)劃任務(wù)為例，該模型能夠自動調(diào)用不同APP，完成景點(diǎn)總結(jié)、地圖收藏、票價查詢、高鐵票預(yù)訂等一系列操作，相當(dāng)于一個智能秘書。在相關(guān)Bench上，該模型也取得了不錯的成績，但也帶來了新的問題，即在超大規(guī)模Agent模型上如何保持其他能力的穩(wěn)定。

2025年被稱為GLM的開源年，智譜AI從1月到12月開源了多個模型，包括語言模型、智能體模型和多模態(tài)模型等。中國開源模型在2025年取得了顯著貢獻(xiàn)，在Artificial Analysis上，前五名基本為中國模型，大模型盲測榜單也顯示中國模型表現(xiàn)出色。但唐杰也指出，不能因開源成果而盲目樂觀，美國閉源大模型的發(fā)展仍不可忽視，中國與美國在大模型領(lǐng)域仍存在差距。

對于未來大模型的發(fā)展，唐杰認(rèn)為可以參考人腦認(rèn)知的學(xué)習(xí)過程。2025年可能是多模態(tài)的適應(yīng)年，目前大多數(shù)模型仍以文本智能提升為主，如何實(shí)現(xiàn)原生多模態(tài)模型，統(tǒng)一感知多模態(tài)信息，是亟待解決的問題，這與人類的“感統(tǒng)”能力相似。模型的記憶能力和可持續(xù)學(xué)習(xí)能力也有待提高，人類擁有多級記憶系統(tǒng)，未來需要為大模型構(gòu)建更完善的記憶系統(tǒng)。同時，反思和自我認(rèn)知能力也是未來發(fā)展的方向，雖然目前模型已有一定反思能力，但自我認(rèn)知仍是難題，值得深入探索。

人類認(rèn)知具有雙系統(tǒng)特點(diǎn)，系統(tǒng)一完成大部分簡單任務(wù)，系統(tǒng)二處理復(fù)雜推理問題。大模型發(fā)展也可參考這一模式，通過Scaling數(shù)據(jù)、推理和自學(xué)習(xí)環(huán)境，讓機(jī)器參考人的學(xué)習(xí)范式，獲得更多學(xué)習(xí)機(jī)會。在系統(tǒng)一方面，雖然Transformer模型可通過增加數(shù)據(jù)和參數(shù)提升性能，但面臨計算復(fù)雜度和顯存等問題，需要探索更好的知識壓縮方法。在系統(tǒng)二方面，需要找到新的Scaling范式，讓機(jī)器能夠自主定義獎勵函數(shù)、交互方法和訓(xùn)練任務(wù)，實(shí)現(xiàn)自我提升。完成真實(shí)場景下的超長任務(wù)也是關(guān)鍵，機(jī)器需要具備像人一樣的規(guī)劃、檢查和反饋能力。

更多>同類資訊

字節(jié)Seedance2.0延遲API開放時間

02-21

谷歌重磅發(fā)布Gemini 3.1 Pro

02-21

OpenAI組建200人團(tuán)隊(duì)研發(fā)AI硬件，無屏智能音箱或2027年2月入局智能家居市場

02-21

AlphaGo核心人物戴維·席爾瓦創(chuàng)業(yè)：繞開大模型，探索強(qiáng)化學(xué)習(xí)新路徑

02-21

Meta再調(diào)整：2026年4月關(guān)閉Messenger.com 用戶僅能通過移動端或Facebook使用

02-21

印度AI實(shí)驗(yàn)室Sarvam發(fā)布兩款MoE架構(gòu)大語言模型本地化測試表現(xiàn)亮眼

02-20

OpenAI進(jìn)軍硬件領(lǐng)域組建200人團(tuán)隊(duì)，無屏AI音箱或2027年面世售價200-300美元

IT之家 2 月 20 日消息，OpenAI 正在從一家純粹的軟件公司向硬件領(lǐng)域擴(kuò)張。《TheInformation》今日報道稱，OpenAI 已經(jīng)組建了一支約 200 人的研發(fā)團(tuán)隊(duì)，專門開發(fā)面向消費(fèi)者（…

02-20

特斯拉Cybercab下線：無方向盤踏板后視鏡，專為Robotaxi服務(wù)而生

02-20

16歲高中生“智斗”詐騙團(tuán)伙助力Netgear網(wǎng)件追回巨額損失護(hù)品牌

02-20

OpenAI組建200人團(tuán)隊(duì)進(jìn)軍硬件領(lǐng)域，無屏AI音箱或2027年2月面世

02-20

Meta持續(xù)調(diào)整戰(zhàn)略：2026年關(guān)閉Messenger.com網(wǎng)頁僅保留移動端與Facebook渠道

02-20

谷歌Gemini 3.1 Pro重磅登場：推理性能躍升，多領(lǐng)域應(yīng)用創(chuàng)新可期

這款升級版模型專為科學(xué)、工程與研究領(lǐng)域的復(fù)雜問題設(shè)計，通過強(qiáng)化核心推理能力，顯著提升了解決前沿難題的效率與精準(zhǔn)度。企業(yè)用戶可登錄VertexAI與Gemini Enterprise平臺獲取服務(wù)；普通消費(fèi)…

02-20

王騰告別小米系轉(zhuǎn)用iPhone 17 跨界睡眠健康賽道引關(guān)注

快科技2月20日消息，原小米中國區(qū)市場部總經(jīng)理、REDMI品牌總經(jīng)理，現(xiàn)任今日宜休科技創(chuàng)始人王騰的一條微博，意外引發(fā)數(shù)碼圈熱議。其分享睡眠質(zhì)量改善的內(nèi)容，發(fā)布設(shè)備顯示為iPhone 17，這也是他自2025…

02-20

3999元！amazfit T-Rex Ultra 2戶外旗艦表發(fā)布：雙頻定位最長177小時續(xù)航

快科技2月20日消息，今天amazfit全球同步發(fā)布全新戶外旗艦手表T-Rex Ultra 2，其在續(xù)航、導(dǎo)航、戶外安全三大方面進(jìn)行了升級。T-Rex Ultra 2采用1.5英寸AMOLED顯示屏，搭配藍(lán)…

02-20

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競爭格局或迎新變局

谷歌近日正式發(fā)布了其最新的人工智能模型——Gemini 3.1Pro，這一版本的推理能力相比前作翻倍，達(dá)到了77.1%的ARC-AGI-2基準(zhǔn)得分，標(biāo)志著谷歌在AI領(lǐng)域的又一次重大突破。此外，Gemin…

02-20

點(diǎn)擊查看更多 +

全站最新

特斯拉Cybercab下線：無方向盤踏板設(shè)計，定價約20萬主打無人商用出行

本田ICON e輕便電動摩托車登場：16歲可騎，續(xù)航81公里還支持換電

2026款奧迪RS5來襲！630馬力插混系統(tǒng) 性能升級能否征服車迷？

科技賦能新春歸途：智慧加能站讓返鄉(xiāng)之路更高效暖心又便捷

零跑D99內(nèi)飾首曝：極簡設(shè)計配懸浮雙屏，增程純電雙動力可選

特斯拉Cybercab下線：無方向盤踏板設(shè)計，商用定價親民，或重塑出行格局

熱門內(nèi)容

本欄最新

特斯拉Cybercab下線：無方向盤踏板后視鏡，專為Robotaxi服務(wù)而生

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競爭格局或迎新變局

特斯拉Cybercab正式下線：無方向盤踏板后視鏡 4月開啟生產(chǎn)

消費(fèi)降級下年輕人如何選車？博越L憑均衡實(shí)力成燃油SUV“黑馬”

特斯拉調(diào)整Cybertruck策略：推59990美元入門款，頂配“野獸版”降價回漲前水平

春晚機(jī)器人“組團(tuán)”引爆消費(fèi)熱潮，抖音電商助力科技好物走進(jìn)千家萬戶

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

智譜創(chuàng)始人唐杰：2026年AI for Science迎爆發(fā)，智譜專注創(chuàng)新謀突破

智譜創(chuàng)始人唐杰：2026年AI for Science迎爆發(fā)，智譜專注創(chuàng)新謀突破