滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

MIT新發(fā)現(xiàn)：AI模型內(nèi)藏“專家?guī)臁保S機調(diào)整竟能激活專業(yè)能力

時間：2026-03-23 18:56:16 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

麻省理工學院計算機科學與人工智能實驗室的一項新研究，為人工智能訓練領(lǐng)域帶來了突破性發(fā)現(xiàn)。研究者甘雨露和菲利普·伊索拉帶領(lǐng)團隊發(fā)現(xiàn)，經(jīng)過充分預訓練的大型AI模型內(nèi)部，竟?jié)摬刂罅烤邆鋵I(yè)能力的“任務專家”，且通過隨機調(diào)整參數(shù)即可激活這些能力，甚至在某些場景下效果優(yōu)于傳統(tǒng)訓練方法。

傳統(tǒng)AI訓練通常需要針對特定任務設計算法，通過大量數(shù)據(jù)迭代優(yōu)化模型參數(shù)。而MIT團隊的研究表明，當模型規(guī)模足夠大且預訓練充分時，參數(shù)空間會形成類似“叢林”的結(jié)構(gòu)，其中分布著各類“專家”——有的擅長數(shù)學推理，有的精通編程，有的善于創(chuàng)意寫作。這種“神經(jīng)叢林”現(xiàn)象顛覆了人們對AI訓練的認知：無需從零培養(yǎng)新能力，只需找到并激活已存在的專家即可。

研究團隊通過實驗驗證了這一發(fā)現(xiàn)。他們以語言模型為例，隨機生成數(shù)千個參數(shù)變化，測試其在數(shù)學、編程、寫作等任務上的表現(xiàn)。結(jié)果顯示，在5億參數(shù)的小模型中，僅約5%的隨機變化能提升性能；而在320億參數(shù)的大模型中，這一比例躍升至60%以上。這意味著，大模型的參數(shù)空間中“專家”密度更高，隨機搜索找到有效解的概率顯著增加。

進一步分析發(fā)現(xiàn)，這些“專家”不僅數(shù)量多，且專業(yè)化程度高。例如，在數(shù)學任務中表現(xiàn)優(yōu)異的參數(shù)變化，在編程任務上可能效果平平，表明模型內(nèi)部形成了真正的分工。研究團隊用“光譜差異度”指標衡量專業(yè)化程度，發(fā)現(xiàn)隨著模型規(guī)模擴大，專家間的差異化愈發(fā)明顯，類似人類社會中職業(yè)分工的細化。

基于這一發(fā)現(xiàn)，團隊開發(fā)了名為RandOpt（隨機優(yōu)化）的訓練算法。該算法分為兩步：首先隨機生成大量參數(shù)變化，篩選出在目標任務上表現(xiàn)最佳的“專家”；然后讓這些專家組成團隊，通過集體投票解決問題。實驗表明，RandOpt在數(shù)學推理、編程、化學反應預測等任務上，效果可媲美甚至超越傳統(tǒng)方法，且訓練時間大幅縮短——無論任務復雜度如何，均只需一輪并行計算。

RandOpt的成功源于預訓練模型的特殊結(jié)構(gòu)。研究團隊將參數(shù)空間比作地形圖，預訓練過程會根據(jù)不同任務數(shù)據(jù)“改造地形”，形成適合各類任務的“高原區(qū)域”。大模型的“高原”更寬廣，隨機搜索碰到有效區(qū)域的概率更高。同一任務可能存在多種解決策略，對應參數(shù)空間中的不同區(qū)域，這種多樣性解釋了專家團隊為何優(yōu)于單個專家。

實驗驗證了理論的普適性。團隊在5億至320億參數(shù)的模型上測試RandOpt，覆蓋數(shù)學、編程、寫作、化學等領(lǐng)域。結(jié)果顯示，隨著模型規(guī)模擴大，RandOpt的效果提升顯著。例如，在70億參數(shù)的模型中，RandOpt將數(shù)學推理準確率從10%提升至85%。在視覺語言模型的圖像問答任務中，RandOpt也將準確率提升了12.4%，表明“神經(jīng)叢林”現(xiàn)象不僅限于文本模型。

深入分析發(fā)現(xiàn)，性能提升源于多重因素。以數(shù)學任務為例，約12.3%的改進來自推理能力提升，19.0%源于輸出格式修正。這表明“專家叢林”包含不同類型：推理專家擅長解決復雜問題，格式專家則能優(yōu)化輸出規(guī)范。在圖像生成任務中，團隊還發(fā)現(xiàn)了“色彩專家”——不同參數(shù)調(diào)整會使圖像傾向不同色調(diào)，進一步證明了專家的多樣性。

這一發(fā)現(xiàn)對AI訓練實踐具有重要啟示。首先，它簡化了訓練流程：傳統(tǒng)方法需多輪迭代調(diào)整超參數(shù)，而RandOpt完全并行，可在3.2分鐘內(nèi)完成200個GPU集群的訓練。其次，它改變了對預訓練模型的理解——預訓練不僅是起點，更是“專家生態(tài)系統(tǒng)”的載體，后續(xù)任務只需發(fā)現(xiàn)并激活已有專家。專家團隊方法提高了可解釋性：通過分析專家特長，可理解模型在何種情況下被激活，增強系統(tǒng)可信度。

盡管RandOpt優(yōu)勢顯著，但其應用仍受限于預訓練質(zhì)量。在預訓練不充分的模型上，專家叢林現(xiàn)象不明顯，隨機搜索效果下降。專家團隊在推理時需更多計算資源，雖可通過知識蒸餾壓縮模型，但增加了系統(tǒng)復雜性。研究團隊指出，未來需探索更智能的專家發(fā)現(xiàn)方法，以及優(yōu)化專家協(xié)作策略，以進一步提升效率。

A：指大型預訓練AI模型的參數(shù)空間中，隱藏著大量具備專業(yè)能力的“任務專家”。這些專家各有所長，隨著模型規(guī)模擴大，其密度和專業(yè)化程度增加，形成類似叢林的結(jié)構(gòu)，隨機搜索即可找到有效解。

A：該算法分兩步：首先隨機生成數(shù)千個參數(shù)變化，篩選目標任務上表現(xiàn)最佳的“專家”；然后讓這些專家組成團隊，通過集體投票解決問題。其優(yōu)勢在于完全并行，無需復雜迭代，訓練時間恒定。

A：目前不能完全替代。其效果高度依賴高質(zhì)量預訓練，更適用于在預訓練模型基礎(chǔ)上快速適應新任務。對于從零訓練或小模型，傳統(tǒng)方法仍是必要選擇。

03-23

AI“求生欲”背后有何玄機？Astradyne研究解碼人工智能自保動機

03-23

上海交大147萬美元打造AI訓練營：代碼修復革命如何重塑程序員未來？

03-23

蘋果RubiCap新突破：AI化身圖像分析師，精準描述每一張圖片細節(jié)

03-23

“伏羲”氣象模型入選十大氣象科技進展，引領(lǐng)預報技術(shù)新跨越

03-23

德克薩斯大學新突破：機器人連續(xù)學習不遺忘，還能提升泛化能力

03-23

誠邁科技南京舉辦生態(tài)大會發(fā)布“龍蝦三件套”AI解決方案賦能多領(lǐng)域

03-23

特高壓與AI雙輪驅(qū)動，賽晶科技業(yè)績飆升，輸配電元器件龍頭未來可期

03-23

卡諾普全球合作伙伴大會：輪式人形機器人亮相，即將征戰(zhàn)德國漢諾威工業(yè)展

03-23

三星與SK海力士企業(yè)級SSD“激戰(zhàn)”：QLC成關(guān)鍵，市場格局生變？

03-23

智象未來推HiDreamClaw：多模態(tài)大模型賦能，開啟垂直內(nèi)容創(chuàng)作新篇

03-23

2026年全球智能手機：NAND漲價難擋，平均存儲容量預計增4.8%

03-23

通威太陽能眉山公司：從“燈塔工廠”到CMMM四級，智能制造再攀高峰

2025年11月28日，評估專家組完成對通威眉山公司的現(xiàn)場評審，并對其在工藝設計、生產(chǎn)制造、物流倉儲、能源管理、裝備運行等環(huán)節(jié)的智能制造系統(tǒng)建設、數(shù)據(jù)應用能力及持續(xù)優(yōu)化機制給予充分肯定。一直以來，通威眉山…

03-23

國家超算互聯(lián)網(wǎng)青島節(jié)點啟動，“海之心”成算力網(wǎng)關(guān)鍵樞紐

3月20日，國家超算互聯(lián)網(wǎng)青島節(jié)點暨“海之心”人工智能計算中心全容量接入儀式在中科曙光全球研發(fā)總部基地舉行。海之心計算中心活動中，國家超算互聯(lián)網(wǎng)青島節(jié)點暨“海之心”人工智能計算中心正式啟動全容量接入。該中…

03-23

長春大冬會倒計時300天：“新寶”亮相科技賦能“冰雪之約”

你可以叫我新寶，歡迎來長春歷史文化博物館玩呀！”“新寶”用科技硬實力與人文軟實力，為長春大冬會注入鮮活科技力，也讓更多人感受到數(shù)字時代下“科技+文化”的無限可能。后續(xù)，“新寶”將正式成為偽滿皇宮博物院與長春歷…

03-23

點擊查看更多 +

全站最新

13年來首次！發(fā)改委出手緊急調(diào)控油價，漲價直接“砍半”

ETF風向標 | A股險守3800點，油氣漲勢凌厲，標普油氣ETF溢價兩連漲停，電網(wǎng)設備ETF、黃金 ETF 成年度吸金主力

龍虎榜 | 美利云漲2.37%，深股通凈賣出2.28億元

飛速創(chuàng)新(03355.HK)上市首日開盤漲34.62%，"企業(yè)網(wǎng)絡解決方案第一股"引發(fā)市場高度關(guān)注

閱文(0772.HK)："IP+AI"引領(lǐng)新增長，漫劇過億、衍生品GMV翻番、短劇破行業(yè)紀錄

美股異動丨小鵬汽車盤前漲2.45% Robotaxi業(yè)務部亮相 GX開啟L4路測

熱門內(nèi)容

本欄最新

美光預測L4級自動駕駛汽車內(nèi)存需求將超300GB 內(nèi)存市場或迎新變局

360團隊獨家發(fā)現(xiàn)OpenClaw高危漏洞智能體網(wǎng)關(guān)安全風險引行業(yè)關(guān)注

東風日產(chǎn)NX8攜天演架構(gòu)2.0登場，大品牌大空間大智慧開啟家庭出行新體驗

變局中穩(wěn)行致遠，東風本田憑品質(zhì)初心與創(chuàng)新韌性繪就合資新畫卷

微博“硅基茶水間”上線：AI專屬社交場人類“圍觀”新體驗

啟境品牌亮相：跨界融合賦能，首款GT7如何開啟智能出行新境界？

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

MIT新發(fā)現(xiàn)：AI模型內(nèi)藏“專家?guī)臁保S機調(diào)整竟能激活專業(yè)能力