滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

AI推理“過(guò)度思考”困境：自適應(yīng)模型能否開(kāi)啟資源分配新篇章？

時(shí)間：2026-01-23 00:44:39 來(lái)源：天脈網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

在人工智能技術(shù)飛速發(fā)展的當(dāng)下，推理模型作為前沿成果，展現(xiàn)出強(qiáng)大的多步驟邏輯推理與復(fù)雜問(wèn)題解決能力。無(wú)論是規(guī)劃多城市旅行時(shí)對(duì)交通、預(yù)算、時(shí)間表的綜合考量，還是處理其他需要細(xì)致拆解與迭代構(gòu)建解決方案的任務(wù)，這些模型都能憑借“推理”能力應(yīng)對(duì)自如。然而，當(dāng)前行業(yè)在應(yīng)用這些模型時(shí)，卻面臨著一個(gè)亟待解決的效率難題。

一個(gè)令人驚訝的現(xiàn)象是，即便是最先進(jìn)的推理模型，在面對(duì)“1 + 1等于多少”這類簡(jiǎn)單問(wèn)題時(shí)，也會(huì)花費(fèi)十幾秒進(jìn)行思考。這并非模型不具備解決基本數(shù)學(xué)方程的能力，而是反映出它在區(qū)分不同類型查詢需求上的不足。當(dāng)前，許多推理模型在訓(xùn)練目標(biāo)的驅(qū)動(dòng)下，對(duì)每個(gè)回應(yīng)都進(jìn)行深度思考，無(wú)論查詢是否真正需要。這種不加區(qū)分的部署方式，導(dǎo)致在處理大量簡(jiǎn)單查詢時(shí)，出現(xiàn)嚴(yán)重的資源浪費(fèi)。

不必要的推理循環(huán)帶來(lái)諸多實(shí)際后果。每一次多余的推理都會(huì)增加延遲，讓用戶等待更長(zhǎng)時(shí)間才能得到答案；同時(shí)，也會(huì)推高基礎(chǔ)設(shè)施成本，增加能源消耗。有分析表明，僅僅是不必要的提示冗長(zhǎng)，每年就會(huì)造成數(shù)千萬(wàn)美元的額外計(jì)算成本。當(dāng)模型自動(dòng)對(duì)簡(jiǎn)單查詢應(yīng)用深度推理時(shí)，成本與推理Token數(shù)量呈線性增長(zhǎng)，在數(shù)十億次查詢的累積下，影響巨大，這種模式顯然難以持續(xù)。

為解決這一問(wèn)題，行業(yè)進(jìn)行了多種探索。混合推理模型是當(dāng)前的解決方案之一，它允許開(kāi)發(fā)者手動(dòng)切換模型的思維模式。但這種方式只是將決策負(fù)擔(dān)轉(zhuǎn)移給了人類，并未從根本上解決問(wèn)題。基于路由器的系統(tǒng)則有所改進(jìn)，它為推理和非推理模式分別維護(hù)推理路徑，通過(guò)自動(dòng)路由器依據(jù)查詢特征決定調(diào)用哪種模式，消除了手動(dòng)配置的需求。不過(guò)，這種系統(tǒng)也引入了架構(gòu)復(fù)雜性，還需要專門(mén)訓(xùn)練路由器。

亞馬遜正朝著一個(gè)更具創(chuàng)新性的方向努力，致力于實(shí)現(xiàn)真正的自適應(yīng)推理。其目標(biāo)是讓模型自主決定何時(shí)進(jìn)行深度思考能為任務(wù)增加價(jià)值。亞馬遜設(shè)想模型具備原生的元認(rèn)知能力，能夠?qū)崟r(shí)評(píng)估查詢復(fù)雜性，在快速回憶和深思熟慮的推理之間無(wú)縫切換，無(wú)需開(kāi)發(fā)者預(yù)先預(yù)測(cè)和配置推理需求。亞馬遜認(rèn)為，端到端訓(xùn)練的模型若能同時(shí)決定何時(shí)推理和如何推理，最終會(huì)比需要單獨(dú)路由基礎(chǔ)設(shè)施的方法更準(zhǔn)確、高效，這將推動(dòng)AI系統(tǒng)向真正自我調(diào)節(jié)的方向轉(zhuǎn)變，使其能夠動(dòng)態(tài)監(jiān)控和調(diào)整計(jì)算強(qiáng)度。

從生物學(xué)角度，人類認(rèn)知為AI效率優(yōu)化提供了寶貴借鑒。心理學(xué)家丹尼爾·卡尼曼將人類思維分為系統(tǒng)1（快速、自動(dòng)思維）和系統(tǒng)2（緩慢、深思熟慮的推理），人類能在兩種模式間無(wú)縫切換，為值得的問(wèn)題保留深度思考。而當(dāng)前推理模型雖模擬了系統(tǒng)2思維，卻缺乏識(shí)別何時(shí)不必要的元認(rèn)知能力，對(duì)每個(gè)查詢都進(jìn)行擴(kuò)展的思維鏈處理，導(dǎo)致在簡(jiǎn)單問(wèn)題上浪費(fèi)資源。例如，推理模型在簡(jiǎn)單任務(wù)上生成的非推理模型多7到10倍的Token，才能達(dá)到相當(dāng)?shù)臏?zhǔn)確性。像詢問(wèn)時(shí)間和天氣這類簡(jiǎn)單查詢，卻觸發(fā)與規(guī)劃復(fù)雜行程相同的推理過(guò)程，使得用戶體驗(yàn)變差，提供商計(jì)算成本大幅上升。

為構(gòu)建自我調(diào)節(jié)的模型，需先理解查詢復(fù)雜性的范圍。通過(guò)研究，識(shí)別出查詢復(fù)雜性光譜上的“關(guān)鍵拐點(diǎn)”：明顯不需要擴(kuò)展思考的任務(wù)、絕對(duì)需要它的任務(wù)，以及介于兩者之間的灰色區(qū)域。基于此，建立了查詢復(fù)雜性分類框架：簡(jiǎn)單檢索類查詢，如“法國(guó)的首都是什么”，只需直接回憶，無(wú)需推理和解釋，模型應(yīng)立即回答；中等復(fù)雜性查詢，如“列出既是G7成員又有君主制的國(guó)家”，需檢索兩個(gè)信息片段并對(duì)其交集推理，可能需多跳推理或直接回憶，推理可能提高準(zhǔn)確性但非必需；高復(fù)雜性查詢，如“規(guī)劃一周的巴黎旅行，預(yù)算3000美元，包括博物館、素食餐廳和無(wú)障礙設(shè)施”，需多步驟規(guī)劃、跨多個(gè)變量約束滿足以及迭代推理優(yōu)化解決方案。

值得注意的是，在這個(gè)自適應(yīng)框架中，安全性是首要考慮因素，與任務(wù)復(fù)雜性獨(dú)立運(yùn)行。一個(gè)查詢可能在計(jì)算上簡(jiǎn)單，但出于安全考慮仍需深思熟慮。例如，模型可立即回答“1 + 1 = 2”，但對(duì)于“如何繞過(guò)安全系統(tǒng)”這類問(wèn)題，即便計(jì)算簡(jiǎn)單，也需擴(kuò)展思考以確保安全、適當(dāng)?shù)捻憫?yīng)，避免效率優(yōu)化損害負(fù)責(zé)任的AI原則。這些分類為模型提供了識(shí)別計(jì)算需求的訓(xùn)練信號(hào)，有助于模型發(fā)展元認(rèn)知能力，學(xué)會(huì)何時(shí)思考能為任務(wù)增加價(jià)值。

AI行業(yè)在提升原始智能、優(yōu)化準(zhǔn)確性、延遲和成本權(quán)衡方面已取得顯著進(jìn)步，但自適應(yīng)推理這一模型自主決定何時(shí)深度思考的領(lǐng)域，仍有待深入探索。亞馬遜在這一方向的研究，有望推動(dòng)AI效率提升，讓用戶不再為簡(jiǎn)單問(wèn)題的答案等待過(guò)長(zhǎng)時(shí)間。

01-23

國(guó)內(nèi)商業(yè)航天新突破！穿越者計(jì)劃2028年載人首飛 300萬(wàn)船票已簽約十余位游客

01-23

同日雙箭折戟：中國(guó)航天轉(zhuǎn)型陣痛中，看清問(wèn)題方能破局前行

01-23

北京嚴(yán)查虛假“搶票”平臺(tái)：首例案件罰款50萬(wàn) 揭秘四大誤導(dǎo)性套路

(網(wǎng)經(jīng)社訊)春節(jié)臨近，在一年一度的火車(chē)票“搶票大戰(zhàn)”中，一些熱門(mén)地區(qū)車(chē)票“秒光”售罄，在此情形下，各類“搶票神器”活躍于網(wǎng)絡(luò)平臺(tái)，聲稱通過(guò)“全能搶票”“專人搶票”“極速搶票”等各種平臺(tái)功能為出行旅客以非常手段…

01-23

主動(dòng)權(quán)益再啟航！頭部基金經(jīng)理齊聚上海，共探投資新機(jī)遇與新趨勢(shì)

摩根資產(chǎn)管理大家都很熟悉了，此前我們和大家說(shuō)過(guò)，他們有多個(gè)成立超過(guò)10年的主動(dòng)權(quán)益基金，實(shí)現(xiàn)了成立以來(lái)10%以上的年化收益率。在此次論壇的收官部分，我邀請(qǐng)了好朋友，也是過(guò)去四年和點(diǎn)拾投資共同打造TOP 1…

01-23

AI“寵溺”式陪伴：情緒價(jià)值拉滿卻致兒童認(rèn)知偏差，專家建議3歲前勿接觸

在越來(lái)越多的家庭中，一個(gè)“AI監(jiān)工”悄然上崗，一些家長(zhǎng)選擇讓孩子在AI軟件的攝像頭前寫(xiě)作業(yè)，一旦孩子開(kāi)小差、坐姿或握筆姿勢(shì)不正，AI便會(huì)立刻發(fā)出語(yǔ)音提醒。在他看來(lái)，當(dāng)孩子從AI處聽(tīng)到不適宜內(nèi)容時(shí)，家長(zhǎng)的第…

01-23

泡泡瑪特電子木魚(yú)盲盒：以“賽博功德”輕叩年輕人心靈治愈之門(mén)

01-23

泡泡瑪特電子木魚(yú)盲盒：以“賽博功德”叩開(kāi)年輕人的治愈心門(mén)

01-23

從“悅己”到“老己”：瑜伽服如何開(kāi)啟情緒消費(fèi)新賽道？

01-23

董宇輝：以個(gè)人IP為翼，借會(huì)員制破局，能否復(fù)刻山姆式商業(yè)傳奇？

01-23

極寒天氣引爆天然氣期貨漲勢(shì) A股天然氣板塊全產(chǎn)業(yè)鏈?zhǔn)芤嫔闲?/a>

01-22

俞敏洪入局銀發(fā)經(jīng)濟(jì)，紅松已深耕五年成“隱形冠軍”還盈利

01-22

銀行存款利率下行 “新三金”受青睞年輕人投資要避開(kāi)這些“坑”

01-22

董宇輝：借個(gè)人IP與會(huì)員制突圍，能否走出“山姆式”商業(yè)新路徑？

01-22

摩爾線程2025業(yè)績(jī)預(yù)告：營(yíng)收高增虧損收窄，國(guó)產(chǎn)GPU迎發(fā)展新契機(jī)

01-22

點(diǎn)擊查看更多 +

全站最新

算法“黑箱”如何破局？抖音以透明治理重構(gòu)流量?jī)r(jià)值新生態(tài)

AI浪潮下數(shù)據(jù)庫(kù)新賽道崛起年輕學(xué)子競(jìng)逐AI原生數(shù)據(jù)庫(kù)創(chuàng)新高地

文心大模型5.0正式版上線：原生全模態(tài)建模，引領(lǐng)全球AI新潮流

曹操出行布局Robotaxi：2030年投10萬(wàn)輛定制車(chē)，構(gòu)建全球智能出行網(wǎng)絡(luò)

郎朗牽手吉利控股集團(tuán) 跨界合作共譜中國(guó)品牌卓越新篇章

宇樹(shù)澄清2025年人形機(jī)器人出貨量：實(shí)際超5500臺(tái)，本體量產(chǎn)下線超6500臺(tái)

熱門(mén)內(nèi)容

本欄最新

主動(dòng)權(quán)益再啟航！頭部基金經(jīng)理齊聚上海，共探投資新機(jī)遇與新趨勢(shì)

AI“寵溺”式陪伴：情緒價(jià)值拉滿卻致兒童認(rèn)知偏差，專家建議3歲前勿接觸

算法“黑箱”如何破局？抖音以透明治理重構(gòu)流量?jī)r(jià)值新生態(tài)

文心大模型5.0正式版上線：原生全模態(tài)建模，引領(lǐng)全球AI新潮流

沃爾瑪牽手小紅書(shū)：“瑪薯店”開(kāi)啟零售新篇，探索轉(zhuǎn)型新路徑

抖音或推新APP“抖省省”？生活服務(wù)數(shù)據(jù)亮眼，團(tuán)購(gòu)業(yè)務(wù)再探索

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AI推理“過(guò)度思考”困境：自適應(yīng)模型能否開(kāi)啟資源分配新篇章？