滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

清華大學團隊打造“智慧AI”：像人類一樣巧分配資源難題上深度思考

時間：2026-01-20 05:22:57 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在人工智能領(lǐng)域，如何讓語言模型更高效地處理復雜問題一直是科研人員關(guān)注的焦點。傳統(tǒng)模型在面對不同難度的問題時，往往采用“一刀切”的處理方式，無論問題簡單與否，都投入相同的計算資源。這種策略不僅浪費算力，還可能導致簡單問題的答案被過度修正。針對這一痛點，清華大學聯(lián)合研究團隊提出了一種名為“Think-at-Hard”（TaH）的創(chuàng)新方法，通過模擬人類“選擇性思考”的機制，顯著提升了AI的推理效率與準確性。

研究團隊發(fā)現(xiàn)，人類在解決問題時具有天然的“認知分層”能力：面對“1+1等于幾”這類簡單問題時，大腦會快速給出答案；而面對“如何緩解城市擁堵”等復雜問題時，則會啟動深度分析模式。然而，現(xiàn)有AI模型缺乏這種動態(tài)調(diào)整能力，導致簡單任務(wù)被過度處理，復雜任務(wù)卻因資源分配不足而表現(xiàn)不佳。為解決這一矛盾，TaH方法引入了“智能選擇機制”，通過輕量級神經(jīng)決策器實時評估每個詞匯的推理難度，僅對邏輯關(guān)聯(lián)詞等關(guān)鍵節(jié)點啟動深度思考，其余內(nèi)容則快速處理。

實驗數(shù)據(jù)顯示，在數(shù)學推理基準測試中，采用TaH方法的6億參數(shù)小模型準確率提升4.0%，17億參數(shù)模型提升5.0%。更關(guān)鍵的是，其平均每個詞匯僅需1.06次迭代處理，遠低于傳統(tǒng)固定策略的2.0次，在保持性能的同時將計算量降低近一半。這種“精準發(fā)力”的策略，使得模型在GSM8K測試中準確率從62.5%躍升至64.4%，在MATH500測試中從47.2%提升至51.2%，展現(xiàn)了小模型也能實現(xiàn)高推理能力的可能性。

TaH方法的核心創(chuàng)新在于三大技術(shù)突破。首先是“雙因果注意力機制”，該機制允許模型在深度思考時跨層級調(diào)用信息，既能看到當前迭代的狀態(tài)，也能回顧初始預測結(jié)果，避免“記憶丟失”導致的錯誤修正。其次是“專業(yè)化模塊設(shè)計”，通過低秩適應(yīng)技術(shù)為不同思考階段配置專用處理單元，確保簡單預測與復雜修正互不干擾。最后是“雙階段訓練策略”，研究團隊先利用預訓練模型生成“理想決策標簽”，再分階段訓練神經(jīng)決策器與主體網(wǎng)絡(luò)，成功破解了“決策質(zhì)量依賴模型表現(xiàn)，模型表現(xiàn)又依賴決策質(zhì)量”的循環(huán)依賴難題。

進一步分析顯示，模型對邏輯連接詞的敏感度遠超預期。在測試中，“但是”觸發(fā)深度思考的概率達34%，“所以”為18%，這類詞匯的精準識別成為提升推理準確率的關(guān)鍵。可視化工具還揭示，不同注意力頭自發(fā)形成了分工協(xié)作模式：部分負責初始信息捕獲，部分專注深度優(yōu)化，部分則平衡兩者關(guān)系。這種類似人類大腦的區(qū)域協(xié)同機制，為AI理解復雜語義提供了新思路。

技術(shù)實現(xiàn)層面，研究團隊通過鍵值緩存拼接與二維因果掩碼技術(shù)，使雙注意力機制完全兼容現(xiàn)有高效計算框架，無需改造底層架構(gòu)即可部署。神經(jīng)決策器采用輕量化設(shè)計，參數(shù)量不足主干網(wǎng)絡(luò)的1%，卻能以83%的準確率預測理想決策。針對訓練數(shù)據(jù)中“簡單詞匯遠多于復雜詞匯”的類別不平衡問題，團隊開發(fā)了動態(tài)權(quán)重調(diào)整算法，有效避免了決策器偏向保守判斷的傾向。

跨領(lǐng)域測試進一步驗證了TaH的通用性。在科學數(shù)據(jù)集上訓練的模型，應(yīng)用于GPQA-diamond基準測試時表現(xiàn)提升4.5個百分點；當最大迭代深度擴展至3層時，平均準確率再獲0.8%的提升。與需要額外預訓練的Ponder方法相比，TaH在保持計算效率的同時實現(xiàn)了更優(yōu)的性能，尤其在資源受限的邊緣設(shè)備場景中表現(xiàn)突出。對決策錯誤的敏感性分析表明，過度修正帶來的性能損失是思考不足的3倍，這從數(shù)據(jù)層面解釋了選擇性策略的優(yōu)勢。

這項研究為AI發(fā)展提供了重要啟示：真正的智能不在于無差別投入算力，而在于像人類一樣動態(tài)分配認知資源。隨著移動端AI應(yīng)用的普及，TaH方法“精準思考”的特性將大幅降低設(shè)備能耗，使智能手機、物聯(lián)網(wǎng)終端等資源受限平臺也能運行高性能語言模型。其背后的“認知經(jīng)濟學”理念，或?qū)⒊蔀橄乱淮鶤I系統(tǒng)設(shè)計的核心原則。

模型參數(shù)規(guī)模決定能力邊界，參數(shù)越多可處理的任務(wù)越復雜，但對計算資源要求更高。為解決大模型訓練與部署的資源問題，模型蒸餾、稀疏化、量化等技術(shù)實現(xiàn)模型壓縮，MoE 架構(gòu)動態(tài)激活參數(shù)，模型并行、數(shù)據(jù)并行提升訓練效率…

02-23

英偉達擬對Rubin GPU的HBM4分檔，平衡性能與供應(yīng)以擴大出貨規(guī)模

02-23

賈躍亭宣布法拉第未來EAI機器人下周首批交付銷售合作與產(chǎn)品規(guī)劃穩(wěn)步推進

02-23

OpenAI 2025年收入超預期達130億美元支出80億 2030年計劃豪擲6000億算力費

02-23

三星Galaxy S26 Ultra真機亮相：驍龍8E5高配+隱私屏技術(shù)引關(guān)注

02-23

法拉第未來EAI機器人下周交付銷售合作取得成果多款產(chǎn)品待發(fā)布

IT之家 2 月 23 日消息，賈躍亭今日發(fā)布視頻，公布了法拉第未來 EAI 機器人進展：下周正式開啟首批交付，F(xiàn)uturist 和Master 銷售和交付所需的前期認證及合規(guī)工作已經(jīng)完成，Aegis 也將…

02-23

三星Galaxy S26 Ultra真機亮相：驍龍8E5高配加持隱私屏技術(shù)成亮點

IT之家 2 月 23 日消息，三星“Galaxy Unpacked”發(fā)布活動將在本周到來，最新一代 Galaxy S26系列旗艦手機即將發(fā)布。博主 @數(shù)碼閑聊站今日發(fā)文：三星 S26 Ultra 真機…

02-23

馬年春節(jié)螞蟻AI業(yè)務(wù)爆發(fā)：支付寶“AI付”與螞蟻阿福APP用戶數(shù)均破億

02-23

科技領(lǐng)航產(chǎn)業(yè)躍升文旅賦能消費煥新江淮大地“十五五”啟幕新篇

02-23

賈躍亭宣布法拉第未來EAI機器人下周首批交付銷售合作取得階段性成果

02-23

春節(jié)AI業(yè)務(wù)大放異彩：螞蟻集團“AI付”與螞蟻阿福APP用戶數(shù)均破億

02-23

OpenAI有望推出ChatGPT Pro Lite訂閱，月費100美元

02-23

法拉第未來EAI機器人下周開啟首批交付

02-23

中望軟件：以“CAD+”戰(zhàn)略為翼，在自主創(chuàng)新中競逐全球工業(yè)軟件藍海

02-23

OpenAI或推ChatGPT Pro Lite訂閱服務(wù) 月費100美元功能升級

02-23

點擊查看更多 +

全站最新

女子自稱孫悟空后人引熱議，攜猴毛靈石求版權(quán)，專家鑒定后鬧劇收場

春節(jié)返程倒計時，自駕、列車、飛機出行安全指南請查收！

小米YU7銷量狂飆：年輕群體與BBA老車主為何紛紛“倒戈”？

蔚來換電春節(jié)火力全開：連續(xù)五日創(chuàng)新高，單日總量突破177627次

比亞迪領(lǐng)匯M9官圖亮相！7座布局配側(cè)滑門 5145mm車長搭載插混系統(tǒng)

春節(jié)假期蔚來換電熱度飆升：單日總量破17.7萬次，連續(xù)五日創(chuàng)新高

熱門內(nèi)容

本欄最新

宇樹CEO王興興：機器人技術(shù)如少年成長，大規(guī)模應(yīng)用未來可期

中國芯片實力獲認可：豐田鈴木等外企選用，成本品質(zhì)雙重優(yōu)勢凸顯

黃仁勛預熱GTC 2026：將推“世界前所未見”芯片突破技術(shù)極限引期待

黃仁勛預熱GTC 2026：將推“世界未見”芯片突破技術(shù)極限引期待

黃仁勛預熱GTC 2026：將推“世界前所未見”芯片突破技術(shù)極限再領(lǐng)跑

黃仁勛預熱GTC 2026：全新芯片將至英偉達突破極限再領(lǐng)跑AI算力

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

清華大學團隊打造“智慧AI”：像人類一樣巧分配資源 難題上深度思考

清華大學團隊打造“智慧AI”：像人類一樣巧分配資源難題上深度思考