滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

Anthropic報(bào)告：AI智能體自主性提升，軟件工程主導(dǎo)但高風(fēng)險(xiǎn)領(lǐng)域待突破

時(shí)間：2026-02-22 21:10:57 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

AI智能體正從實(shí)驗(yàn)室走向現(xiàn)實(shí)應(yīng)用場(chǎng)景，全球主要科技企業(yè)均已推出相關(guān)產(chǎn)品，但其在真實(shí)環(huán)境中的運(yùn)行模式仍籠罩在神秘面紗之下。近日，人工智能研究機(jī)構(gòu)Anthropic通過(guò)分析數(shù)百萬(wàn)次人機(jī)交互數(shù)據(jù)，首次系統(tǒng)梳理了AI智能體在實(shí)際部署中的關(guān)鍵特征，為行業(yè)提供了重要參考。

研究團(tuán)隊(duì)對(duì)Claude Code及其公共API的交互記錄進(jìn)行隱私保護(hù)分析后發(fā)現(xiàn)，該模型單次連續(xù)自主運(yùn)行時(shí)長(zhǎng)呈現(xiàn)顯著增長(zhǎng)趨勢(shì)。在2025年10月至2026年1月期間，極端情況下（第99.9百分位）的自主運(yùn)行時(shí)間從25分鐘延長(zhǎng)至45分鐘以上，而中位數(shù)時(shí)長(zhǎng)穩(wěn)定在45秒左右。這種增長(zhǎng)并非單純?cè)从谀Ｐ蜕?jí)，用戶信任積累、任務(wù)復(fù)雜度提升以及產(chǎn)品優(yōu)化等因素同樣起到關(guān)鍵作用。

數(shù)據(jù)顯示，經(jīng)驗(yàn)豐富的用戶更傾向于讓AI完全自主工作。當(dāng)用戶使用次數(shù)超過(guò)750次時(shí)，40%以上的會(huì)話采用全自動(dòng)模式，而新用戶（使用次數(shù)少于50次）的這一比例僅為20%。值得注意的是，隨著使用經(jīng)驗(yàn)增加，用戶主動(dòng)打斷模型的比例從5%上升至9%，表明人類監(jiān)督并未減弱，而是轉(zhuǎn)向更精準(zhǔn)的干預(yù)時(shí)機(jī)。

在任務(wù)處理效率方面，Claude Code展現(xiàn)出顯著進(jìn)步。2025年8月至12月間，其處理高難度任務(wù)的成功率翻倍，同時(shí)每個(gè)會(huì)話的人工干預(yù)次數(shù)從5.4次降至3.3次。研究認(rèn)為，這表明AI在實(shí)際應(yīng)用中的自主空間可能超出用戶預(yù)設(shè)范圍，經(jīng)驗(yàn)用戶更懂得如何釋放模型潛力。

不同復(fù)雜度任務(wù)中的人機(jī)協(xié)作模式呈現(xiàn)明顯差異。在修改單行代碼等簡(jiǎn)單任務(wù)中，87%的工具調(diào)用需要人工參與；而在查找零日漏洞或編寫編譯器等復(fù)雜任務(wù)中，這一比例降至67%。研究指出，復(fù)雜任務(wù)往往由資深用戶發(fā)起，且步驟繁多導(dǎo)致實(shí)時(shí)審批困難，這是人工參與度下降的主要原因。

模型自身的風(fēng)險(xiǎn)控制機(jī)制同樣值得關(guān)注。面對(duì)復(fù)雜任務(wù)時(shí)，Claude Code因不確定而主動(dòng)請(qǐng)求澄清的次數(shù)是人類打斷次數(shù)的兩倍以上。這種自我約束行為被視為重要的安全機(jī)制，能夠有效預(yù)防潛在錯(cuò)誤擴(kuò)散。研究強(qiáng)調(diào)，智能體主動(dòng)確認(rèn)問(wèn)題比被動(dòng)接受糾正更具預(yù)防價(jià)值。

在應(yīng)用領(lǐng)域分布方面，軟件工程占據(jù)AI智能體活動(dòng)的近半壁江山，醫(yī)療、金融和網(wǎng)絡(luò)安全等高風(fēng)險(xiǎn)領(lǐng)域也開(kāi)始出現(xiàn)應(yīng)用案例。雖然目前高風(fēng)險(xiǎn)操作占比不足1%，但其潛在影響不容忽視。研究特別指出，公共API執(zhí)行的操作中，絕大多數(shù)具有低風(fēng)險(xiǎn)和可逆性特征。

這項(xiàng)研究也存在局限性。由于僅分析單一模型提供商的數(shù)據(jù)，且對(duì)公共API的會(huì)話級(jí)行為缺乏完整觀察，結(jié)論的普適性有待驗(yàn)證。基于此，研究團(tuán)隊(duì)向行業(yè)提出多項(xiàng)建議：加強(qiáng)部署后監(jiān)控系統(tǒng)建設(shè)、訓(xùn)練模型識(shí)別自身不確定性、開(kāi)發(fā)更高效的用戶監(jiān)督工具，同時(shí)避免過(guò)早制定固定交互規(guī)范。

02-22

2026年存儲(chǔ)芯片崛起：AI浪潮下內(nèi)存成新引擎，投資機(jī)遇凸顯

02-22

松延動(dòng)力“仿生蔡明”亮相春晚后：技術(shù)突破助力真蔡明獲贈(zèng)機(jī)器人

02-22

宇樹(shù)CEO王興興：機(jī)器人技術(shù)如10歲孩童，大規(guī)模應(yīng)用未來(lái)可期

我們可以看到每年機(jī)器人技術(shù)都有持續(xù)的進(jìn)步，盡管如此，真正進(jìn)入大規(guī)模應(yīng)用階段仍然需要一些時(shí)間。在去年春晚的《武BOT》節(jié)目中，一臺(tái)宇樹(shù)機(jī)器人打著醉拳摔倒在地，瞬間引發(fā)網(wǎng)友的熱烈討論，大家紛紛猜測(cè)：是故意摔…

02-22

2026機(jī)器人技術(shù)前瞻：VLX突破、靈巧操控與移動(dòng)操控的融合新局

人形機(jī)器人、移動(dòng)上半身的物體操控，以及多指手這類復(fù)雜操作末端的研發(fā)，是目前產(chǎn)業(yè)當(dāng)中的最熱門的研究方向，也是比較難啃的硬骨頭。相關(guān)的經(jīng)典實(shí)驗(yàn)場(chǎng)景和技術(shù)路徑都被反復(fù)驗(yàn)證，后續(xù)的研究更多是在具體的技術(shù)設(shè)計(jì)和工程實(shí)…

02-22

國(guó)產(chǎn)半導(dǎo)體新突破！8英寸鈮酸鋰晶圓量產(chǎn)，開(kāi)辟換道超車新路徑

2026年2月22日，國(guó)產(chǎn)半導(dǎo)體迎來(lái)重大突破：國(guó)內(nèi)廠商成功量產(chǎn)8英寸鈮酸鋰晶圓，良率突破70%，達(dá)到商用標(biāo)準(zhǔn)，華為等企業(yè)已內(nèi)部試用，用于光通信、射頻芯片與高速連接模塊。在全球科技競(jìng)爭(zhēng)激烈的今天，8英寸鈮酸鋰晶…

02-22

中國(guó)科學(xué)家研發(fā)天文AI“星衍” 解鎖暗弱天體刷新深空探測(cè)極限

我國(guó)科學(xué)家基于計(jì)算光學(xué)原理與人工智能算法，開(kāi)發(fā)出天文AI模型“星衍”，可解鎖暗弱天體信號(hào)，探測(cè)到超過(guò)130億光年的星系，并獲取目前國(guó)際已知探測(cè)最深的深空影像。《科學(xué)》審稿人評(píng)價(jià)，該研究為探測(cè)宇宙提供了“強(qiáng)大…

02-22

AI賦能新體驗(yàn)：用Typeless“口噴”成文，開(kāi)啟高效寫作新紀(jì)元

02-22

英偉達(dá)300億美元投資OpenAI，原1000億美元長(zhǎng)期合作意向或生變

去年9月22日，OpenAI 和英偉達(dá)共同宣布了一份長(zhǎng)期的戰(zhàn)略合作伙伴關(guān)系意向書， OpenAI 的下一代 AI 基礎(chǔ)設(shè)施將部署至少 10吉瓦的英偉達(dá)AI系統(tǒng)，以訓(xùn)練和運(yùn)行其下一代模型。《金融時(shí)報(bào)》最…

02-22

星衍”出鞘！中國(guó)科學(xué)家解鎖深空密碼探秘130億光年外宇宙奧秘

02-22

孫宇晨：刪掉「90前」聯(lián)系人，勿沾老登氣息

02-22

宇樹(shù)科技王興興談機(jī)器人：技術(shù)進(jìn)步快，大規(guī)模應(yīng)用或3至10年可期

02-22

AI賦能可信數(shù)據(jù)空間：2026年驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)躍升與跨域協(xié)同創(chuàng)新新路徑

2026年人工智能賦能可信數(shù)據(jù)空間發(fā)展研究報(bào)告指出，數(shù)據(jù)作為數(shù)字經(jīng)濟(jì)核心生產(chǎn)要素，其高效流通面臨“不愿、不敢、不會(huì)共享”的難題，可信數(shù)據(jù)空間成為破解數(shù)據(jù)孤島的關(guān)鍵，而人工智能技術(shù)則為其建設(shè)提供了核心驅(qū)動(dòng)力，…

02-22

Cursor從巔峰到靜默：AI敘事狂飆下，技術(shù)王者為何難逃被遺忘？

02-22

AI狂潮下泡沫疑云：54位科技與投資界大咖如何看待？

02-22

點(diǎn)擊查看更多 +

全站最新

春運(yùn)返程高峰至，掌握這些應(yīng)急妙招讓你的歸途安全又順暢

Rivian 2026年開(kāi)年發(fā)力：全新電動(dòng)平臺(tái)亮相三款新車搭載4695電池來(lái)襲

汽車保養(yǎng)去4S店還是外面修理廠？老司機(jī)總結(jié)：分情況選，養(yǎng)車省錢又省心

高速匝道匯入主路總被“卡”？掌握這些技巧，新手也能從容又安全！

2025美國(guó)新車質(zhì)量榜：雷克薩斯奪冠，日系美系韓系上榜，德系僅保時(shí)捷“幸存”

Rivian 2026開(kāi)年放大招：新平臺(tái)亮相，三款新車齊發(fā)，續(xù)航充電雙升級(jí)

熱門內(nèi)容

本欄最新

中國(guó)芯片實(shí)力獲認(rèn)可：豐田鈴木等外企選用，成本品質(zhì)雙重優(yōu)勢(shì)凸顯

黃仁勛預(yù)熱GTC 2026：將推“世界前所未見(jiàn)”芯片突破技術(shù)極限引期待

黃仁勛預(yù)熱GTC 2026：將推“世界未見(jiàn)”芯片突破技術(shù)極限引期待

黃仁勛預(yù)熱GTC 2026：將推“世界前所未見(jiàn)”芯片突破技術(shù)極限再領(lǐng)跑

黃仁勛預(yù)熱GTC 2026：全新芯片將至英偉達(dá)突破極限再領(lǐng)跑AI算力

從對(duì)話到實(shí)干：豆包大模型2.0化身全能助手，多領(lǐng)域展現(xiàn)驚人動(dòng)手能力

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Anthropic報(bào)告：AI智能體自主性提升，軟件工程主導(dǎo)但高風(fēng)險(xiǎn)領(lǐng)域待突破