岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè):繞開大模型,以強(qiáng)化學(xué)習(xí)叩響超級智能之門

   時間:2026-02-21 01:39:04 來源:快訊編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

前谷歌DeepMind首席科學(xué)家、AlphaGo項目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence",并啟動規(guī)模達(dá)10億美元的種子輪融資。這一融資規(guī)模與OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024年創(chuàng)立Safe Superintelligence(SSI)時持平,標(biāo)志著AI領(lǐng)域新一輪技術(shù)路線競爭的開啟。

與當(dāng)前主流的大語言模型(LLM)技術(shù)路徑不同,席爾瓦提出要"回歸強(qiáng)化學(xué)習(xí)本質(zhì)"。他主張構(gòu)建完全自主的智能系統(tǒng),通過與環(huán)境交互積累經(jīng)驗,而非依賴人類標(biāo)注的文本數(shù)據(jù)。這一理念源于其2025年4月與導(dǎo)師查理·薩頓(Charlie Sutton)聯(lián)合發(fā)表的論文《歡迎來到經(jīng)驗時代》,論文強(qiáng)調(diào)智能體應(yīng)通過持續(xù)試錯實現(xiàn)自我進(jìn)化。

作為強(qiáng)化學(xué)習(xí)領(lǐng)域的標(biāo)志性人物,席爾瓦的學(xué)術(shù)影響力顯著。其論文被引用超28萬次,2019年獲得的ACM計算獎印證了他在該領(lǐng)域的技術(shù)權(quán)威性。更引人注目的是,他主導(dǎo)開發(fā)的AlphaGo、AlphaZero和MuZero等系統(tǒng),已驗證強(qiáng)化學(xué)習(xí)在規(guī)則明確環(huán)境中的突破性潛力——AlphaZero僅用三天自我對弈就超越人類千年圍棋經(jīng)驗,MuZero更在完全不知規(guī)則的情況下掌握多類游戲策略。

技術(shù)路線的分歧正在重塑AI產(chǎn)業(yè)格局。當(dāng)前主流模型如GPT系列和Gemini系列,均采用"預(yù)訓(xùn)練+微調(diào)"范式,通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律。但席爾瓦指出,這種路徑存在根本性局限:AI的能力上限被人類標(biāo)注數(shù)據(jù)的質(zhì)量和數(shù)量所束縛。他特別批評了依賴人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的后訓(xùn)練方式,認(rèn)為這導(dǎo)致模型認(rèn)知水平無法超越人類評估員。

Ineffable Intelligence的愿景是打造"持續(xù)學(xué)習(xí)的超級智能"。知情人士透露,該公司計劃開發(fā)能通過模擬環(huán)境自我博弈的系統(tǒng),從基礎(chǔ)原理推導(dǎo)問題解決方案。這種技術(shù)路線在AlphaGo與李世石對決中已現(xiàn)端倪——第37手看似違背所有已知定式,實則是AI通過計算發(fā)現(xiàn)的人類未知規(guī)律,這種"不可言說"的智慧正是公司名稱的由來。

資本市場對席爾瓦的押注反映了對"后大模型時代"的技術(shù)期待。接近交易的投資人表示,10億美元融資主要基于兩點:席爾瓦在DeepMind期間證明的技術(shù)轉(zhuǎn)化能力,以及強(qiáng)化學(xué)習(xí)在復(fù)雜決策場景中的潛在突破。但質(zhì)疑聲同樣存在:現(xiàn)實世界存在規(guī)則模糊、反饋稀疏等挑戰(zhàn),強(qiáng)化學(xué)習(xí)在此類環(huán)境中的有效性尚未得到充分驗證。

AI領(lǐng)域正經(jīng)歷路線分化。除席爾瓦外,參與AlphaGo項目的部分科學(xué)家近期創(chuàng)立了Reflection AI,meta則在楊立昆帶領(lǐng)下重組"超級智能實驗室"探索新架構(gòu)。這種局面被行業(yè)觀察家比作2010年代深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期——當(dāng)時主流方法尚未收斂,不同學(xué)派在競爭中推動技術(shù)躍遷。

目前,Ineffable Intelligence已在倫敦組建核心團(tuán)隊,并啟動全球強(qiáng)化學(xué)習(xí)專家的招募計劃。盡管尚未公布產(chǎn)品路線圖,但該公司對算力資源的巨額投入,預(yù)示其可能構(gòu)建超大規(guī)模的數(shù)字孿生系統(tǒng)進(jìn)行AI訓(xùn)練。這場由技術(shù)理念差異引發(fā)的產(chǎn)業(yè)變革,或?qū)⒅匦露x通用人工智能(AGI)的發(fā)展路徑。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 国产免费二区 | 亚洲我射av | 久操网站 | 91久久婷婷 | 久久伊人综合 | 欧美日韩在线视频免费 | 成人福利视频在线 | 一级黄色片一级黄色片 | 久久久www成人免费精品 | 亚洲精品午夜 | 欧美性大交 | 99re在线观看| 久久激情视频 | 国产视频第一区 | 亚洲免费网址 | 亚洲精品在线免费播放 | 久草精品视频在线观看 | 午夜在线播放视频 | 久久精品视频18 | 在线看黄色av | 亚洲伦理网 | 最新国产网站 | 免费黄网站在线观看 | 日韩伦乱视频 | 天天操,夜夜操 | a在线免费 | 亚洲第一黄色 | 香蕉视频在线观看网站 | 欧美三级欧美成人高清 | 欧美一级录像 | 婷婷久久综合 | 黄色裸体网站 | 亚洲经典av | 日本中文字幕在线 | 日本一区二区三区中文字幕 | 超碰人人av | 麻豆chinese新婚xxx | dy888午夜 | 在线观看av网站 | 日韩av视屏| www在线观看视频 |