滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

AI智能體開發“偏科”嚴重：編程領域扎堆，多數職業領域成“被遺忘的角落”

時間：2026-03-08 17:04:27 來源：ITBEAR編輯：快訊 IP：北京 發表評論無障礙通道

卡內基梅隆大學與斯坦福大學聯合開展的一項研究顯示，當前人工智能智能體的開發方向存在顯著偏差，其應用場景過度集中于編程領域，而覆蓋其他職業的比例嚴重不足。研究人員通過對比美國O*NET職業數據庫與43個主流智能體基準測試中的72342項任務，發現計算機與數學類職業僅占美國就業人口的7.6%，卻占據了智能體開發任務的絕對主導地位。

在數字化程度較高的職業領域，這種失衡尤為突出。管理類職業的數字化率達88%，但在智能體基準測試中的任務占比僅1.4%；法律行業數字化率70%，對應占比0.3%；建筑與工程領域數字化率71%，占比同樣不足1%。研究人員指出，這些領域雖然存在目標模糊、成果驗證周期長等技術挑戰，但恰恰是AI智能體能夠快速提升生產力的方向。從經濟價值維度分析，管理、法律等高薪領域的基準測試覆蓋率與其創造的資本價值嚴重不匹配，而個人服務、護理等勞動密集型低薪領域則幾乎被完全忽視。

技能維度的對比數據進一步印證了這種偏差。研究團隊將職業技能劃分為信息獲取、思維處理、人際互動和工作成果四大類，發現現實職業中這四類技能需求分布相對均衡。然而智能體基準測試中，超過95%的任務集中在"信息獲取"和"計算機操作"兩類技能，而涉及大量現實工作的"人際互動"類技能幾乎未被覆蓋。這種選擇傾向主要源于方法論便利性——任務指令編寫和結果驗證難度較低的領域更容易獲得開發資源。

在評估智能體實際能力時，研究團隊建立了量化自主性指標體系，將智能體在既定成功率下可處理的任務復雜度作為核心參數，復雜度通過分層工作流的步驟數衡量。測試結果顯示，即使在軟件開發這個覆蓋最充分的領域，當任務復雜度提升時，智能體成功率仍會出現斷崖式下降。具體來看，智能體在獨立思維處理和成果產出方面表現較好，但在信息檢索和人機協作等基礎環節表現欠佳，這在中等復雜度任務中尤為明顯。

對比實驗數據顯示，在少數可進行跨框架測試的基準中，OpenHands框架的表現優于SWE-agent，Claude模型的表現優于GPT系列，這種差距在中等復雜度任務中達到峰值。不過研究人員強調，這些結論存在局限性，不同復雜度級別的表現差異可能很大。他們呼吁智能體開發者公開更多運行軌跡數據，以便建立更系統的評估體系。

針對當前問題，研究團隊提出三項改進建議：一是優先開發覆蓋管理、法律等數字化高薪領域或跨領域綜合基準；二是提升基準測試的真實性和復雜性，人工編寫的任務設計應優于自動生成；三是建立精細化評估機制，通過提取人類工作流設置中間檢查點，精準定位智能體失效環節。研究團隊已開放相關框架和工具，幫助基準設計者識別覆蓋缺口，指導開發者明確改進方向，并協助用戶選擇適合的智能體自主等級。

第三方數據印證了這種開發偏差的現實影響。Anthropic公司對數百萬次人機交互的分析顯示，軟件開發類工具調用占公共API中智能體應用的近50%，而其他行業的應用比例均不足5%。加州大學伯克利分校2025年末的研究也發現，企業目前主要將智能體作為簡單、受控的工具使用，系統可靠性仍是制約自主操作的主要障礙。這種應用現狀與當前基準測試的覆蓋范圍形成閉環，凸顯了行業轉型的迫切性。

更多>同類資訊

重慶交大團隊突破技術壁壘：環焊機器人填補鐵路拱橋智能焊接雙重空白

03-08

OpenClaw飛書插件上線：以用戶身份助力文檔查詢日程核對與群聊理解

03-08

非科班跨界者楊涵涵：48小時3000元，用AI打造爆款短劇沖向院線電影

03-08

Karpathy“后AGI”體驗：AI自主優化代碼110次，人類研究員輕松“躺平”

03-08

云端智能體崛起：AI編程進入自主規劃時代，35%代碼交付成新常態

03-08

高中生零代碼創業新招：AI“龍蝦軍團”高效運轉月成本僅400美元

03-08

廣汽豐田鉑智7預售開啟！15.68萬起享豪華配置，打造純電家轎新標桿

03-08

汽零企業借同源優勢入局：北美AIDC燃氣發電機市場潛力待掘

03-08

價格因人而異：索尼被曝測試動態定價

03-08

OpenClaw最強外掛出現：小龍蝦抓不到數據有救了！

03-08

中電信量子辟謠：REED ONE GK5量子通信手機與集團無關聯

03-08

黃仁勛預言軟件行業新變革：AI智能體驅動，傳統軟件模式或成過去式

03-08

OpenAI二度推遲ChatGPT“成人模式” 研發重心轉向核心功能優化

03-08

通研院發布新一代人形機器人框架OmniXtreme 解鎖高動態動作成功率超九成

03-08

但斌談AI未來：投資領域或現“超能AI”，基金經理崗位面臨挑戰？

03-08

點擊查看更多 +

全站最新

儲能需求狂飆，鋰電材料藏著哪些新機遇？

賽道牛股頻出，下一個千億龍頭是它？

比亞迪大唐來襲：950km續航加9分鐘快充，40萬級市場再掀波瀾

領克06 Relive暮光紫新色登場限時優惠配置豐富實力出圈

比亞迪三車齊發“678組合”登場，閃充領航開啟新能源全民新時代

國產純電崛起：保值率榜單大洗牌，特斯拉光環不再國產車成新寵

熱門內容

本欄最新

廣汽豐田鉑智7預售開啟！15.68萬起享豪華配置，打造純電家轎新標桿

OpenAI二度推遲ChatGPT“成人模式”上線聚焦智能與個性化升級

昊鉑A800廣州上市：補貼后16.48萬起，廣汽華為共探智能豪華新路徑

大廠AI三年：高壓與成長并存，真實經歷分享及超實用解壓秘籍

智能出行新標桿：“賽博雅迪”以用戶為中心引領兩輪電動新風潮

AI賦能自媒體運營：六步搭建“人工智能應用”資訊自動發文流水線

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AI智能體開發“偏科”嚴重：編程領域扎堆，多數職業領域成“被遺忘的角落”