滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

AlphaGo核心人物戴維·席爾瓦創業：繞開大模型，探索強化學習新路徑

時間：2026-02-21 00:03:28 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

前谷歌DeepMind首席科學家、AlphaGo項目核心負責人戴維·席爾瓦（David Silver）近日宣布在倫敦創立人工智能公司"Ineffable Intelligence"，引發科技界廣泛關注。這家初創企業正推進總額達10億美元的種子輪融資，規模已接近OpenAI前首席科學家伊利亞·蘇茨克維（Ilya Sutskever）創立的Safe Superintelligence（SSI）所創下的融資紀錄。

與當前主流的大語言模型技術路徑不同，席爾瓦提出要突破現有框架，回歸強化學習的本質。他主張構建能夠自主探索未知領域的智能系統，而非依賴人類既有知識庫。這種技術理念源于其長期研究實踐——作為圖靈獎得主查理·薩頓（Charlie Sutton）的門生，席爾瓦的學術論文累計被引用超過28萬次，2019年更獲得ACM計算獎。

2025年4月，席爾瓦與導師聯合發表的《歡迎來到經驗時代》論文系統闡述了其技術主張。他們認為新一代AI系統應通過持續與環境交互獲取經驗，而非單純依賴靜態數據訓練。這種思路直接體現在新公司的技術方向上：開發能夠自我迭代、通過試錯積累知識的超級智能系統。

資本市場對這位技術領袖的押注頗具戰略眼光。接近交易的投資人透露，10億美元融資的達成主要基于兩點考量：席爾瓦在強化學習領域的權威地位，以及其提出的"后大模型時代"技術路線可能帶來的顛覆性突破。當前主流AI模型均采用"預訓練+微調"模式，通過海量文本數據學習語言規律，但席爾瓦指出這種路徑存在根本性局限——AI的能力上限被人類數據規模所束縛。

在席爾瓦看來，現有技術路線過度依賴人類反饋強化學習（RLHF），導致模型認知水平難以突破評估員的認知邊界。"要實現超越人類的智能，必須讓AI具備自主探索能力。"他在近期播客節目中強調，"真正的突破需要發現人類尚未掌握的規律。"

科技界正經歷顯著的技術路線分化。除席爾瓦外，參與AlphaGo項目的多名科學家近期創立Reflection AI，meta則在楊立昆（Yann LeCun）帶領下重組"超級智能實驗室"，探索非Transformer架構的新路徑。行業觀察家指出，當前局面類似于深度學習爆發前的技術探索期，各大實驗室都在尋找突破大語言模型局限的新方案。

不過，強化學習路線也面臨現實挑戰。批評者認為，該技術在圍棋等規則明確的環境中表現優異，但在現實世界這種開放環境中，稀疏的反饋信號和模糊的規則體系可能限制其有效性。完全摒棄語言學習路徑意味著需要構建極其復雜的數字孿生系統，其算力需求可能呈指數級增長。

目前，Ineffable Intelligence已在倫敦組建核心團隊，并啟動全球頂尖強化學習專家的招募工作。雖然尚未公布具體產品時間表，但這家初創企業的技術方向和資源投入，已被視為影響AI技術演進的關鍵變量。其能否突破現有技術瓶頸，或將重新定義人工智能的發展軌跡。

02-21

印度AI實驗室Sarvam發布兩款MoE架構大語言模型本地化測試表現亮眼

02-20

OpenAI進軍硬件領域組建200人團隊，無屏AI音箱或2027年面世售價200-300美元

IT之家 2 月 20 日消息，OpenAI 正在從一家純粹的軟件公司向硬件領域擴張。《TheInformation》今日報道稱，OpenAI 已經組建了一支約 200 人的研發團隊，專門開發面向消費者（…

02-20

特斯拉Cybercab下線：無方向盤踏板后視鏡，專為Robotaxi服務而生

02-20

16歲高中生“智斗”詐騙團伙助力Netgear網件追回巨額損失護品牌

02-20

OpenAI組建200人團隊進軍硬件領域，無屏AI音箱或2027年2月面世

02-20

Meta持續調整戰略：2026年關閉Messenger.com網頁僅保留移動端與Facebook渠道

02-20

谷歌Gemini 3.1 Pro重磅登場：推理性能躍升，多領域應用創新可期

這款升級版模型專為科學、工程與研究領域的復雜問題設計，通過強化核心推理能力，顯著提升了解決前沿難題的效率與精準度。企業用戶可登錄VertexAI與Gemini Enterprise平臺獲取服務；普通消費…

02-20

王騰告別小米系轉用iPhone 17 跨界睡眠健康賽道引關注

快科技2月20日消息，原小米中國區市場部總經理、REDMI品牌總經理，現任今日宜休科技創始人王騰的一條微博，意外引發數碼圈熱議。其分享睡眠質量改善的內容，發布設備顯示為iPhone 17，這也是他自2025…

02-20

3999元！amazfit T-Rex Ultra 2戶外旗艦表發布：雙頻定位最長177小時續航

快科技2月20日消息，今天amazfit全球同步發布全新戶外旗艦手表T-Rex Ultra 2，其在續航、導航、戶外安全三大方面進行了升級。T-Rex Ultra 2采用1.5英寸AMOLED顯示屏，搭配藍…

02-20

谷歌Gemini 3.1 Pro發布：推理能力躍升，AI競爭格局或迎新變局

谷歌近日正式發布了其最新的人工智能模型——Gemini 3.1Pro，這一版本的推理能力相比前作翻倍，達到了77.1%的ARC-AGI-2基準得分，標志著谷歌在AI領域的又一次重大突破。此外，Gemin…

02-20

特斯拉Cybercab正式下線：無方向盤踏板后視鏡 4月開啟生產

02-20

賣不出去！特斯拉Cybertruck降價1.5萬美元

02-20

科技整活！PS5手柄直接操控大疆掃地機器人

02-20

谷歌發布Gemini 3.1 Pro 推理性能較上一代提升超一倍

02-20

點擊查看更多 +

全站最新

比亞迪122度磷酸鐵鋰刀片電池登場！三大創新解決痛點，開啟電動出行新時代

經典重現！伏爾加借力長安汽車，俄羅斯汽車市場再掀新波瀾

年后手機圈大戲開場！OPPO Find X9 Ultra與vivo X300 Ultra影像對決誰更強？

年后手機圈“卷”影像！OPPO Find X9 Ultra與vivo X300 Ultra攜增距鏡來襲

美國總統特朗普：政府停擺沖擊經濟，呼吁美聯儲降息

谷歌Gemini 3.1 Pro發布：推理能力躍升，AI競爭格局或迎新變局

熱門內容

本欄最新

特斯拉Cybercab下線：無方向盤踏板后視鏡，專為Robotaxi服務而生

谷歌Gemini 3.1 Pro發布：推理能力躍升，AI競爭格局或迎新變局

特斯拉Cybercab正式下線：無方向盤踏板后視鏡 4月開啟生產

消費降級下年輕人如何選車？博越L憑均衡實力成燃油SUV“黑馬”

特斯拉調整Cybertruck策略：推59990美元入門款，頂配“野獸版”降價回漲前水平

春晚機器人“組團”引爆消費熱潮，抖音電商助力科技好物走進千家萬戶

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AlphaGo核心人物戴維·席爾瓦創業：繞開大模型，探索強化學習新路徑