滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

AI智能體開發“偏科”嚴重：編程領域受寵，多數職業領域遭冷落

時間：2026-03-08 18:41:38 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

卡內基梅隆大學與斯坦福大學聯合開展的一項研究指出，當前人工智能智能體的開發方向存在顯著偏差，其應用場景過度集中于編程領域，對其他行業覆蓋嚴重不足。研究人員通過對比43個智能體基準測試與美國勞動力市場數據發現，現有開發模式僅覆蓋了7.6%的就業崗位，而管理、法律等數字化程度較高的領域反而被邊緣化。

該研究依托美國勞工部O*NET數據庫，將72342項測試任務映射至1016種職業類別。數據顯示，管理類工作數字化率達88%，但在基準測試中僅占1.4%；法律行業數字化率70%，占比不足0.3%；建筑與工程領域數字化率71%，占比同樣只有0.7%。這些領域雖面臨目標模糊、成果驗證周期長等技術挑戰，但研究人員認為其具備短期提升生產力的潛力。

從經濟價值維度分析，管理、法律等高收入行業在基準測試中的占比與其創造的資本價值嚴重失衡。與此同時，個人服務、護理等勞動密集型低薪行業也幾乎未被納入開發視野。研究人員構建的技能分類體系顯示，現實工作需要信息獲取、思維處理、人際互動、工作成果四類技能的均衡運用，但智能體測試僅聚焦前兩類，覆蓋就業市場不足5%，人際互動類任務則鮮有涉及。

這種偏差源于開發方法的技術便利性。研究人員指出，易于編寫指令和驗證結果的領域獲得過度關注，導致資源分配偏離社會經濟效益最大化的方向。OpenAI的GDPval基準測試因覆蓋32個專業領域被樹為正面案例，該測試專門設計用于評估智能體對知識工作的實際影響，盡管規模較小但領域覆蓋廣泛。

在自主性評估方面，研究團隊提出量化指標：以分層工作流步驟數衡量任務復雜度，結合成功率計算智能體自主處理能力。測試顯示，即便在軟件開發領域，任務復雜度提升也會導致成功率驟降。智能體在獨立思維處理和成果產出方面表現較好，但在信息檢索和人機協作等基礎環節仍存在明顯短板。

對比實驗表明，OpenHands框架在中等復雜度任務中優于SWE-agent，Claude模型表現優于GPT，但研究人員強調這些結論不適用于所有復雜度級別。他們呼吁開發方公開智能體運行軌跡數據，以便開展系統性對比分析。針對基準測試設計，研究提出三大原則：優先覆蓋數字化程度高但開發不足的領域；任務設計需反映真實工作場景的復雜性；建立中間檢查點實現精細化評估。

現實應用數據印證了研究結論。Anthropic公司對數百萬次人機交互的分析顯示，軟件開發占智能體工具調用的近50%，其他行業占比均不足5%。加州大學伯克利分校的研究也指出，企業目前僅將智能體作為簡單受控工具使用，系統可靠性仍是制約自主操作的主要障礙。該研究提供的分析框架和工具包，可幫助開發者識別覆蓋缺口并優化改進方向。

更多>同類資訊

重慶交大團隊突破高原鐵路拱橋焊接難題智能環焊機器人填補國內雙重空白

03-08

開源AI“龍蝦”走紅背后：能“動手”干活卻存安全風險需警惕

03-08

GPT-5.4發布：AI電腦操作超越人類，白領崗位面臨變革與挑戰

03-08

Scrapling成OpenClaw“神助攻”：輕松繞攔截，網頁抓取穩又省！

03-08

聚焦“十五五”：新能源汽車、人工智能等熱詞，共繪成渝發展新藍圖

會上，全國人大代表，重慶渝富控股集團有限公司黨委書記、董事長謝文輝介紹，“十五五”期間，重慶渝富控股集團將圍繞成渝地區打造全國重要產業創新策源地這一戰略目標，持續加大國有基金對科技創新的支持力度，助力成渝地…

03-08

黃仁勛預言軟件行業新變革：AI智能體驅動，傳統軟件模式或將落幕

【環球網科技綜合報道】3月8日消息，據eTeknix報道，英偉達CEO黃仁勛近日在摩根士丹利科技大會上發表重磅觀點，指出未來軟件行業將迎來全面“智能體化”變革，傳統軟件模式將向AI智能體驅動轉型，“笨”軟件…

03-08

OpenAI二次推遲ChatGPT“成人模式”上線資源傾斜核心功能優化

【環球網科技綜合報道】3月8日消息，據Axios報道，人工智能企業OpenAI近日宣布再次推遲ChatGPT“成人模式”的上線計劃，將研發資源優先投入到提升產品智能水平、優化個性化體驗等核心功能的打磨上。 …

03-08

黃仁勛預言軟件行業巨變：AI智能體驅動轉型，“笨”軟件將成歷史

【環球網科技綜合報道】3月8日消息，據eTeknix報道，英偉達CEO黃仁勛近日在摩根士丹利科技大會上發表重磅觀點，指出未來軟件行業將迎來全面“智能體化”變革，傳統軟件模式將向AI智能體驅動轉型，“笨”軟件…

03-08

AI智能體開發“偏科”嚴重：編程領域扎堆，多數職業領域成“被遺忘的角落”

03-08

重慶交大團隊突破技術壁壘：環焊機器人填補鐵路拱橋智能焊接雙重空白

03-08

OpenClaw飛書插件上線：以用戶身份助力文檔查詢日程核對與群聊理解

03-08

非科班跨界者楊涵涵：48小時3000元，用AI打造爆款短劇沖向院線電影

03-08

Karpathy“后AGI”體驗：AI自主優化代碼110次，人類研究員輕松“躺平”

03-08

云端智能體崛起：AI編程進入自主規劃時代，35%代碼交付成新常態

03-08

高中生零代碼創業新招：AI“龍蝦軍團”高效運轉月成本僅400美元

03-08

點擊查看更多 +

全站最新

2026科大訊飛學習機全系列測評：從基礎款到旗艦版，選對型號助力孩子高效學習

助聽器怎么選？三款熱門產品實測大揭秘，滿足多樣聽力需求

國產純電崛起：保值率榜單“大洗牌”，特斯拉“失守”前三之位

小米汽車風道專利落地，空氣動力學優化助力續航“零成本”提升

三八婦女節雷軍送祝福！小米女車主購車不只看顏值，內在情緒價值成關鍵

小米代號“昆侖”增程SUV“YU9”路測現真容真燈點亮家族設計元素亮眼

熱門內容

本欄最新

廣汽豐田鉑智7預售開啟！15.68萬起享豪華配置，打造純電家轎新標桿

OpenAI二度推遲ChatGPT“成人模式”上線聚焦智能與個性化升級

昊鉑A800廣州上市：補貼后16.48萬起，廣汽華為共探智能豪華新路徑

大廠AI三年：高壓與成長并存，真實經歷分享及超實用解壓秘籍

智能出行新標桿：“賽博雅迪”以用戶為中心引領兩輪電動新風潮

AI賦能自媒體運營：六步搭建“人工智能應用”資訊自動發文流水線

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AI智能體開發“偏科”嚴重：編程領域受寵，多數職業領域遭冷落