在今天舉行的2026中關(guān)村論壇年會開源主題圓桌上,月之暗面創(chuàng)始人楊植麟和智譜CEO張鵬,小米MiMo大模型負(fù)責(zé)人羅福莉,以及無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪、香港大學(xué)助理教授、博士生導(dǎo)師、Nanobot團(tuán)隊負(fù)責(zé)人黃超等業(yè)界重量級人物齊聚一堂,對AI行業(yè)大家關(guān)心的問題進(jìn)行深入探討。
小米新模型的推出,讓擁有DeepSeek背景的羅福莉進(jìn)一步成為大眾視線的焦點。羅福莉在中關(guān)村論壇的現(xiàn)身,和一眾頭部模型公司大佬同臺論道,對小米大模型來說,無疑也是一次“抬咖”。
以下是羅福莉在這場圓桌會談中的發(fā)言匯總:
楊植麟:現(xiàn)在最流行的就是OpenClaw,大家在日常使用或者類似產(chǎn)品時,覺得什么最有想象力或印象深刻?
羅福莉:我認(rèn)為OpenClaw是一個非常革命性和顛覆性的事件。雖然深度Coding的人首選可能還是Code,但用過OpenClaw的人會感受到它在Agent框架設(shè)計上是領(lǐng)先于Code的,Code的最新更新其實都在向OpenClaw靠近。
它給我的最大價值在于“開源”:這有利于社區(qū)深入?yún)⑴c。它把國內(nèi)次頂級閉源模型的上限拉得非常高,在絕大部分場景下任務(wù)完成度已非常接近最新模型,同時又靠Skill體系保證了下限。
它點燃了大家的想象力。大家發(fā)現(xiàn)大模型外的Agent層有巨大空間,更多人不僅是研究員,開始參與AGI變革,這在一定程度上替代了重復(fù)工作,釋放了時間去做更有想象力的事。
楊植麟:羅福莉,小米最近通過發(fā)布新模型和開源技術(shù)對社區(qū)做出了貢獻(xiàn),小米做大模型有什么獨特優(yōu)勢?
羅福莉:我想先不談小米的獨特優(yōu)勢,而是談?wù)勚袊竽P蛨F(tuán)隊的優(yōu)勢。
兩年前,中國團(tuán)隊在算力受限,尤其是互聯(lián)帶寬受限的情況下,做出了突破:在低端算力限制下,通過模型結(jié)構(gòu)創(chuàng)新(如DPCV3、M1、MA等)去追求最高效率。這給了我們勇氣和信心。
雖然現(xiàn)在國產(chǎn)芯片不再受限,但這種對高效率、低推理成本的探索依然重要。例如,現(xiàn)在的Hybrid、SPA、Linear Attention結(jié)構(gòu)等。
為什么結(jié)構(gòu)創(chuàng)新重要?因為OpenClaw越用越聰明的前提是推理Context。現(xiàn)在的難題是:怎么在1M或10M的長上下文下,做到成本夠低、速度夠快?只有這樣,才能激發(fā)高生產(chǎn)力任務(wù),實現(xiàn)模型自迭代,在復(fù)雜環(huán)境中依靠超長Context完成自我進(jìn)化。
我們現(xiàn)在正在探索Long Context Efficient架構(gòu),以及如何在真實長距離任務(wù)上做到穩(wěn)定和高上限。
更長期看,隨著推理需求爆發(fā),今年可能增長100倍,競爭維度將下探到算力、推理芯片甚至能源層面。
楊植麟:最后我們來做一個開放式展望。想請各位用一個詞來描述接下來十二個月大模型發(fā)展的趨勢,以及你的期望。
羅福莉:我覺得,把這個問題縮小到一年,其實非常有意義。因為如果放到五年,從我自己對AGI的定義來看,我甚至?xí)X得它已經(jīng)實現(xiàn)了。
如果要用一個詞來描述接下來一年里,AGI進(jìn)程中最關(guān)鍵的一件事,我認(rèn)為會是“自進(jìn)化”。
雖然這個詞聽起來有點玄,過去一年大家也提過很多次,但我最近才真正對它有了更深的體會。更重要的是,我開始看到“自進(jìn)化”這件事,已經(jīng)出現(xiàn)了一個更務(wù)實、可落地、可實操的路徑。
原因在于,借助于足夠強(qiáng)大的模型,我們之前在chat這個范式下,其實并沒有真正發(fā)揮出預(yù)訓(xùn)練模型的上限。而這個上限,現(xiàn)在正在被Agent框架激活。尤其是當(dāng)模型開始執(zhí)行更長時間任務(wù)的時候,我們會發(fā)現(xiàn),它是可以自己學(xué)習(xí)、自己進(jìn)化的。
一個很簡單的嘗試就是:在現(xiàn)有的Agent框架里,給它疊加一個可驗證的約束條件,再給它設(shè)置一個loop,讓模型不停下來,持續(xù)地圍繞目標(biāo)迭代優(yōu)化。這樣我們就會發(fā)現(xiàn),它能夠不斷拿出更好的方案。
如果這種自進(jìn)化持續(xù)下去,現(xiàn)在其實已經(jīng)可以跑一兩天了,國內(nèi)很多模型基本都能做到,當(dāng)然這也和任務(wù)難度有關(guān)。比如在一些科學(xué)研究任務(wù)里,像探索更好的模型結(jié)構(gòu),因為模型結(jié)構(gòu)本身有明確的評估標(biāo)準(zhǔn),比如更低的perplexity,這類任務(wù)就比較適合驗證。我們已經(jīng)發(fā)現(xiàn),在這種確定性較高的任務(wù)上,模型能夠自主運行和演化兩三天。
所以從我的角度看,自進(jìn)化是目前唯一一個真正有機(jī)會創(chuàng)造“新東西”的方向。它不是簡單替代現(xiàn)有人的生產(chǎn)力,而是像頂尖科學(xué)家一樣,去探索這個世界上原本還不存在的東西。
其實一年前,我還覺得這個進(jìn)程可能需要三到五年;但就在最近,我開始覺得這個時間尺度應(yīng)該縮短到一到兩年。也就是說,我們很可能在近期就能看到:大模型疊加一個很強(qiáng)的自進(jìn)化Agent框架后,對科學(xué)研究帶來至少指數(shù)級的加速。
因為我最近已經(jīng)觀察到,我們組內(nèi)做大模型研究的同學(xué),他們的workflow本身就高度不確定、依賴創(chuàng)造力。而借助Claude Code,再加上頂尖模型,基本已經(jīng)能夠把我們自己的研究效率提升接近十倍。
所以我非常期待,這樣的范式能夠輻射到更廣泛的學(xué)科和領(lǐng)域。我覺得這是接下來非常重要的一件事。










