滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

Transformer發明者警示：AI研究或陷局部優化陷阱，新架構探索迫在眉睫

時間：2026-01-17 18:16:50 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在人工智能領域，Transformer架構曾被視為革命性突破，但如今其核心發明者之一Llion Jones發出警告：過度依賴現有架構可能阻礙通用人工智能（AGI）的真正突破。這位Sakana AI創始人指出，當前學術界和產業界對Transformer的微調研究，可能重蹈循環神經網絡（RNN）被迅速取代的覆轍。

Jones以RNN的興衰史為例說明技術迭代的殘酷性。在Transformer出現前，RNN占據主導地位長達數年，研究者們不斷優化其門控單元位置或語言建模性能，但這些局部改進最終被Transformer徹底顛覆。他直言："當新架構帶來數量級差異時，所有微調工作都會顯得毫無意義。"這種擔憂正源于他對當前研究生態的觀察——論文普遍聚焦于調整歸一化層位置或改進訓練技巧，而非探索根本性創新。

這種研究范式被Jones稱為"架構彩票"陷阱。他援引2020年提出的"硬件彩票"理論指出，Transformer的勝利本質上是契合了當時GPU計算生態的偶然結果。盡管已有研究證明某些新架構在特定任務上表現更優，但整個行業仍難以放棄Transformer，因為其配套工具鏈和訓練方法已高度成熟。這種路徑依賴形成強大的"重力井"，使得任何新架構都需要達到"碾壓式優勢"才能獲得關注。

當前大語言模型（LLM）的局限性進一步印證了Jones的判斷。他指出這些模型呈現出"鋸齒狀智能"特征：既能解決博士級難題，又會犯下小學生級別的錯誤。這種矛盾暴露了現有架構的根本缺陷——將所有功能強行塞入單一框架，而非通過架構創新實現更自然的知識表示。"我們像在給瑞士軍刀添加新工具，卻從未思考是否需要重新設計工具本身。"Jones比喻道。

為突破這種循環，Jones團隊轉向生物啟發的研究路徑。他們開發的連續思維機（CTM）模擬大腦神經元的同步振蕩機制，通過神經動態表示實現漸進式計算。這種設計并非追求完全生物學還原，而是借鑒其核心信息傳遞方式。研究團隊特意避開學術圈常見的"搶發壓力"，用充足時間完善對照實驗，希望為高風險探索樹立典范。

這場范式轉移之爭正引發行業深層反思。OpenAI前首席科學家Ilya Sutskever近期也表示，單純擴大現有架構規模不足以實現AGI。但挑戰在于，在真正突破出現前，任何局部改進都可能被視為必要探索。Jones承認這種困境："就像RNN研究者直到Transformer出現才意識到自己陷入死胡同，我們現在同樣無法預知下一個范式轉移何時到來。"

當前研究格局呈現出矛盾圖景：一方面，混合專家模型、注意力機制變體等改進持續涌現；另一方面，少數研究者開始探索神經形態計算、世界模型等全新方向。這種分化折射出AI發展的關鍵轉折點——當技術積累達到臨界點時，行業必須抉擇是繼續優化現有路徑，還是冒險開辟未知領域。Jones的警告恰似一記警鐘：在追求AGI的競賽中，最危險的陷阱或許正是我們當前最依賴的"成功經驗"。

更多>同類資訊

松下結構性改革再升級：裁員擴至1.2萬，AI項目推倒重來業績承壓

02-05

博通推出企業級Wi-Fi 8 AP與交換機方案，為AI就緒型企業網絡賦能

IT之家 2 月 4 日消息，博通 (Broadcom) 美國加州當地時間昨日宣布推出企業級 Wi-Fi 8 (802.11bn) 規范 AP接入點與 Switch 交換機解決方案，宣稱是業界首款專為 AI…

02-05

瑞莎Cubie A7S AI開發板發布：199元起，高效適配本地化AI應用場景

全志 A733 芯片采用異構八核架構：包含兩個主頻 2.0GHz 的 Cortex-A76 核心（處理高負載任務）、六個主頻 1.8GHz 的Cortex-A55 核心（處理后臺任務），同時集成 3 TO…

02-05

端側AI新突破：面壁智能MiniCPM-o 4.5如何讓AI更懂人類真實交互？

此前，面壁智能的 MiniCPM-V系列曾展示這樣一個案例：在車載記錄儀上，告訴用戶剛才路過了幾家怎么樣的店鋪，但它還是一種概念的驗證，更像是一種“事后總結”；而本次發布的模型MiniCPM-o 4.5…

02-05

英特爾拓展新領域：進軍GPU芯片市場，向英偉達發起挑戰

隨著英特爾繼續推進企業轉型，公司首席執行官承諾將開始生產一種由競爭對手英偉達主導的新型芯片。值得注意的是，譚普輝在去年3月擔任首席執行官時曾表示公司將專注于核心業務，而現在英特爾涉足GPU領域確實是一次顯…

02-05

聯發科：人工智能導致供應鏈成本上升將調整定價

02-05

消息稱前云度汽車CEO林密已低調再創業

02-05

黃仁勛駁斥AI取代軟件論稱其“不合邏輯”

02-05

Apple在Xcode 26.3中引入AI編程代理

02-05

火山引擎創作Agent升級

02-05

松下增設首席人工智能官，發力2026“增長階段轉向”

02-05

2026春晚新科技來襲！8K、AIGC特效引領觀眾體驗新高度

02-05

工信部發力：突破算力芯片與工業大模型，繪就“人工智能+制造”新藍圖

02-05

中醫館跨界藥膳餐廳：“先把脈再用餐”走紅，銀發經濟下前景幾何？

02-05

博通首推企業級Wi-Fi 8方案：融合AI與多千兆技術賦能智能網絡未來

博通Wi-Fi8產品組合是首個在所有交換機端口和接入點上實現MACsec的解決方案，提供所謂的"完整"端到端安全性，同時引入了先進的遙測和分析引擎。A：博通的Wi-Fi 8解決方案是首款專為AI就緒企業…

02-05

點擊查看更多 +

全站最新

華為前首席科學家陳亦倫揭秘：2020年團隊攻克端到端自動駕駛技術難關

太空數據中心：馬斯克熱情高漲繪藍圖，亞馬遜潑冷水指現實難題

中產消費新選擇：折扣羽絨服熱銷，務實理性成主流

華為前首席科學家陳亦倫：2020年攻克端到端自動駕駛規控難題

2026年B級純電SUV新選擇！比亞迪宋Ultra EV預告發布，性能科技雙升級

小米SU7遼寧營口起火事件新進展：消防認定系車內火源引燃非車輛自燃

熱門內容

本欄最新

英飛凌2026財年首季財報：營收利潤雙增，未來投資擴產加速AI布局

豐田加碼混動賽道：2028年產量劍指670萬，多家車企布局混動市場

卡奧斯赴港IPO：借AI與物聯網雙翼引領工業數智化轉型新征程

西部數據煥新啟航：正式更名WD，聚焦AI與云計算開啟增長新篇章

技術前瞻布局+爆款車型助力元戎啟行智駕賽道市占率攀升新高度

純電車型智能新篇：智能互聯與語音交互引領未來出行新潮流

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Transformer發明者警示：AI研究或陷局部優化陷阱，新架構探索迫在眉睫