岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

智譜創(chuàng)始人唐杰:2026年AI for Science迎爆發(fā),智譜專注創(chuàng)新謀突破

   時間:2026-01-11 12:12:15 來源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

近期,大模型領(lǐng)域發(fā)展勢頭迅猛,智譜AI與minimax相繼完成上市,月之暗面KIMI也成功獲得5億美元融資,整個行業(yè)正從概念階段加速邁向商業(yè)化落地。

在智譜AI成功上市后,其創(chuàng)始人、清華大學(xué)教授唐杰發(fā)表了一場公開演講。他指出,2026年極有可能成為AI for Science的爆發(fā)之年,隨著各項(xiàng)能力的顯著提升,眾多領(lǐng)域?qū)⒂瓉硇碌陌l(fā)展契機(jī)。

唐杰詳細(xì)闡述了智譜AI在2026年的重點(diǎn)規(guī)劃。首先,在Scaling方面將持續(xù)推進(jìn),不斷擴(kuò)充數(shù)據(jù)規(guī)模,探索模型性能的上限,同時積極探索未知的新范式。其次,技術(shù)創(chuàng)新是關(guān)鍵,公司將致力于全新的模型架構(gòu)研發(fā),著力解決超長上下文處理、高效知識壓縮等難題,并實(shí)現(xiàn)知識記憶與持續(xù)學(xué)習(xí)功能,為模型賦予更強(qiáng)大的能力。多模態(tài)感統(tǒng)能力將成為今年的熱點(diǎn)與重點(diǎn),這一能力的突破將使AI能夠勝任機(jī)器中的長任務(wù)、長時效任務(wù),進(jìn)而在人類的工作環(huán)境中發(fā)揮作用,助力AI實(shí)現(xiàn)具身智能,真正融入物理世界。

唐杰回顧了自己的科研歷程,自2006年從清華大學(xué)畢業(yè)后的20年里,他主要專注于兩件事:一是開發(fā)AMiner系統(tǒng),二是投身于大模型研究。他以“像喝咖啡一樣上癮”的精神投身科研,這種專注與堅持促使他抓住了AGI這一長期投入領(lǐng)域的機(jī)遇。

智譜AI實(shí)驗(yàn)室在2019年做出了重大戰(zhàn)略調(diào)整,暫停了當(dāng)時在國際上表現(xiàn)不錯的圖神經(jīng)網(wǎng)絡(luò)和知識圖譜研究方向,全體人員轉(zhuǎn)向大模型研究。經(jīng)過多年的努力,取得了顯著成果。從大模型智能水平的發(fā)展歷程來看,2020年時模型僅能處理一些簡單的MMU和QA問題,到2021 - 2022年已能夠完成數(shù)學(xué)推理題,再到2023 - 2024年可以處理研究生水平的復(fù)雜問題,甚至在真實(shí)世界的編程問題上也表現(xiàn)出色,智能水平不斷提升,如同人類成長一般逐步積累知識、提升能力。

在提升模型泛化能力方面,唐杰表示,目前主要通過Scaling來實(shí)現(xiàn),但模型的泛化能力仍有待提高。早期通過Transformer訓(xùn)練模型,數(shù)據(jù)和算力的增加提升了長時知識記憶能力,但泛化能力有限。后來通過對齊和推理,利用持續(xù)的Scaling SFT和強(qiáng)化學(xué)習(xí),尤其是今年可驗(yàn)證獎勵強(qiáng)化學(xué)習(xí)(RLVR)的爆發(fā),使模型能夠通過可驗(yàn)證環(huán)境自主探索反饋數(shù)據(jù),實(shí)現(xiàn)自我成長。然而,RLVR也面臨挑戰(zhàn),如可驗(yàn)證場景的局限性,如何拓展到半自動或不可驗(yàn)證場景,實(shí)現(xiàn)模型的通用化,是亟待解決的問題。同時,未來機(jī)器將在物理世界承擔(dān)真實(shí)任務(wù),構(gòu)建智能體環(huán)境也面臨諸多挑戰(zhàn)。

2025年初,DeepSeek的出現(xiàn)給研究界和產(chǎn)業(yè)界帶來了巨大沖擊,其性能強(qiáng)大,令人震撼。唐杰認(rèn)為,在DeepSeek的范式下,Chat時代的問題可能已基本得到解決,未來AI的發(fā)展將開啟新范式,即讓每個人能夠運(yùn)用AI完成實(shí)際任務(wù)。在這一選擇上,智譜AI選擇了賦予模型Thinking能力,并整合Coding、Agentic、Reasoning能力,于2025年7月28日發(fā)布了4.5版本,在智能體、推理、代碼等多個Benchmark上取得了優(yōu)異成績。但該版本在實(shí)際編程場景中也暴露出一些問題,如無法完成復(fù)雜的“植物大戰(zhàn)僵尸”編程任務(wù),這促使公司利用RLVR可驗(yàn)證的強(qiáng)化學(xué)習(xí)環(huán)境,結(jié)合編程環(huán)境反饋和SFT數(shù)據(jù),提升了模型效果。

在Web能力開發(fā)方面,智譜AI也取得了一定進(jìn)展,通過可驗(yàn)證環(huán)境提升了模型在SWE Bench上的得分。然而,將模型能力整合到主模型仍面臨挑戰(zhàn),真實(shí)用戶體驗(yàn)與跑分結(jié)果可能存在差異。為此,公司開發(fā)了全異步的訓(xùn)練強(qiáng)化學(xué)習(xí)框架,統(tǒng)一訓(xùn)練大量RL任務(wù),提升了Agent和Coding能力,最新發(fā)布的4.7版本在相關(guān)方面有了顯著提升。在真實(shí)場景評測中,公司邀請眾多編程高手進(jìn)行人工評測,但仍有許多問題有待解決。

在構(gòu)建Coding Agent環(huán)境方面,智譜AI基于Github數(shù)據(jù)實(shí)現(xiàn)了自動化構(gòu)建,但將大量RL任務(wù)統(tǒng)一訓(xùn)練也面臨任務(wù)長度和時間不同的難題。公司開源的全異步訓(xùn)練強(qiáng)化學(xué)習(xí)框架解決了這一問題,提升了Agent和Coding能力。同時,在讓AI完成復(fù)雜任務(wù)方面,如監(jiān)控小紅書并整理相關(guān)討論生成文檔,需要將API與GUI混合使用,通過抽取大量數(shù)據(jù)并進(jìn)行全異步強(qiáng)化學(xué)習(xí),賦予AI一定的泛化能力。為克服冷啟動問題,公司采用SFT與強(qiáng)化學(xué)習(xí)交替的訓(xùn)練算法,提升了模型在移動環(huán)境下的效果,并在多任務(wù)大模型強(qiáng)調(diào)學(xué)習(xí)上開展了相關(guān)工作。

2025年12月,智譜AI開源了AutoGLM 9B模型,該模型在人機(jī)交互中執(zhí)行速度快,開源后迅速獲得了大量關(guān)注。以旅行規(guī)劃任務(wù)為例,該模型能夠自動調(diào)用不同APP,完成景點(diǎn)總結(jié)、地圖收藏、票價查詢、高鐵票預(yù)訂等一系列操作,相當(dāng)于一個智能秘書。在相關(guān)Bench上,該模型也取得了不錯的成績,但也帶來了新的問題,即在超大規(guī)模Agent模型上如何保持其他能力的穩(wěn)定。

2025年被稱為GLM的開源年,智譜AI從1月到12月開源了多個模型,包括語言模型、智能體模型和多模態(tài)模型等。中國開源模型在2025年取得了顯著貢獻(xiàn),在Artificial Analysis上,前五名基本為中國模型,大模型盲測榜單也顯示中國模型表現(xiàn)出色。但唐杰也指出,不能因開源成果而盲目樂觀,美國閉源大模型的發(fā)展仍不可忽視,中國與美國在大模型領(lǐng)域仍存在差距。

對于未來大模型的發(fā)展,唐杰認(rèn)為可以參考人腦認(rèn)知的學(xué)習(xí)過程。2025年可能是多模態(tài)的適應(yīng)年,目前大多數(shù)模型仍以文本智能提升為主,如何實(shí)現(xiàn)原生多模態(tài)模型,統(tǒng)一感知多模態(tài)信息,是亟待解決的問題,這與人類的“感統(tǒng)”能力相似。模型的記憶能力和可持續(xù)學(xué)習(xí)能力也有待提高,人類擁有多級記憶系統(tǒng),未來需要為大模型構(gòu)建更完善的記憶系統(tǒng)。同時,反思和自我認(rèn)知能力也是未來發(fā)展的方向,雖然目前模型已有一定反思能力,但自我認(rèn)知仍是難題,值得深入探索。

人類認(rèn)知具有雙系統(tǒng)特點(diǎn),系統(tǒng)一完成大部分簡單任務(wù),系統(tǒng)二處理復(fù)雜推理問題。大模型發(fā)展也可參考這一模式,通過Scaling數(shù)據(jù)、推理和自學(xué)習(xí)環(huán)境,讓機(jī)器參考人的學(xué)習(xí)范式,獲得更多學(xué)習(xí)機(jī)會。在系統(tǒng)一方面,雖然Transformer模型可通過增加數(shù)據(jù)和參數(shù)提升性能,但面臨計算復(fù)雜度和顯存等問題,需要探索更好的知識壓縮方法。在系統(tǒng)二方面,需要找到新的Scaling范式,讓機(jī)器能夠自主定義獎勵函數(shù)、交互方法和訓(xùn)練任務(wù),實(shí)現(xiàn)自我提升。完成真實(shí)場景下的超長任務(wù)也是關(guān)鍵,機(jī)器需要具備像人一樣的規(guī)劃、檢查和反饋能力。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 四虎在线观看 | 亚洲精品一区在线 | 黄色在线免费播放 | 国产精品自拍网站 | 成人一区二区三区视频 | 69精品视频 | 国产精品久久久久久久久果冻传媒 | 91大神精品| 超碰人人人人 | 国产精品久久国产精品 | 国产视频欧美 | 国产精品爽 | 欧美亚洲专区 | 成人短视频在线免费观看 | 中文字幕视频网站 | 欧美一a一片一级一片 | 久久国产精品波多野结衣 | 国产黄a三级三级看三级 | 欧美视频福利 | 亚洲20p| 日本一道在线观看 | 黄色午夜网站 | 免费日本黄色网址 | 四虎永久免费在线观看 | 欧美日韩一区二区三区四区 | 亚洲v国产v欧美v久久久久久 | 久久综合久 | 国产福利二区 | 免费看久久 | 久操伊人网 | 亚洲精品国产一区 | 色综合久久88色综合天天 | 日韩国产精品毛片 | 天天天天操 | 国产第一网站 | 外国av网站| 亚洲成人动漫在线观看 | 精品国产99久久久久久 | 在线97| 免费观看毛片网站 | 综合欧美日韩 |