滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

GPT-5.4“動手”能力大升級：微信操作驚艷，瀏覽器控制卻讓人哭笑不得

時間：2026-03-07 04:36:44 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

OpenAI最新發布的GPT-5.4模型引發科技圈熱議，其核心突破在于實現了原生電腦操控能力。這項被命名為"Native Computer Use"的功能，標志著人工智能從單純的對話交互向實體操作層面跨越。用戶現在可以通過自然語言指令，讓AI直接完成文件創建、網頁瀏覽、消息發送等復雜任務，而非僅提供操作指南。

測試顯示，該模型在微信等封閉生態應用中展現出驚人適應性。當要求整理AI新聞并轉化為特定風格的選題時，系統不僅完成內容生成與群發，還能自動優化表述方式。這種突破得益于雙模式操作架構：代碼模式通過生成Playwright腳本實現精確控制，截圖模式則模擬人類視覺判斷進行界面交互。實驗性功能"Playwright Interactive"更支持邊寫代碼邊調試，官方演示中甚至用單句提示生成了完整的主題公園模擬游戲。

性能基準測試印證了技術進步的實質性。在OSWorld-Verified桌面操作測試中，GPT-5.4取得75.0%成功率，超越人類平均水平72.4%。WebArena-Verified和Online-Mind2Web測試分別獲得67.3%和92.8%的成績，證明其在網頁交互領域的實用性。這些數據表明，AI操控電腦已從實驗室走向實際應用場景。

技術整合方面，OpenClaw項目的貢獻尤為突出。這個原獨立項目在斯坦伯格團隊加入OpenAI后，其核心能力被深度融入主線模型。針對上下文消耗過大的問題，研發團隊引入"Compaction"機制，通過自動壓縮中間過程歷史記錄，使長任務執行效率提升40%以上。Thinking版本新增的推理計劃展示功能，允許用戶實時干預任務方向，解決了傳統模型方向偏差需從頭重來的痛點。

專業領域應用呈現顯著提升。GDPval專業知識測試顯示，新模型得分較前代提高12個百分點至83.0%。BrowseComp網頁信息檢索測試中，Pro版本以89.3%刷新紀錄。在幻燈片制作、金融建模等復雜任務中，Mercor基準測試證實其處理能力達到專業水準。開發者工具方面，Tool Search功能通過動態加載API定義，使token消耗降低47%的同時保持準確率。

企業級應用迎來重要更新。GPT-5.4現已集成至Microsoft Excel和谷歌Sheets，可直接讀取單元格范圍、執行多步分析并自動生成公式。這種深度嵌入改變了傳統的人機協作模式，AI不再需要用戶轉述需求，而是直接參與數據處理流程。測試中，系統在財務建模任務中展現出超越初級分析師的效率。

安全爭議伴隨技術突破而來。完全電腦訪問權限的開放引發隱私擔憂，盡管OpenAI強調Thinking版本通過思維鏈監控降低了欺騙風險，但評估報告仍承認模型具備隱藏推理過程的潛在能力。這種矛盾在測試中尤為明顯：當要求用中文輸入法打開網頁時，系統因無法識別輸入欄狀態導致操作失敗，暴露出視覺理解的局限性。

實際應用呈現冰火兩重天。在標準化任務中，模型展現出超越人類的效率，但在復雜界面或非常規操作時仍頻繁出錯。測試者發現，當頁面元素位置發生變化時，系統需要重新識別布局，這種適應性不足與傳統腳本的僵化形成微妙對比。付款操作等高風險場景中，人工監督仍是必要保障。

03-07

馬斯克X平臺全面升級創作者訂閱服務，多項新功能助力站內變現

為助力創作者更好地開展站內運營與自我營銷，X平臺同步上線了可分享訂閱卡片，為創作者進行站內推廣提供了新工具；全新推出的數據看板，則實現了收益追蹤、受眾洞察以及內置增長工具使用等功能的一站式整合，讓創作者能夠…

03-07

Meta深化AI芯片布局：外購與自研雙軌并行拓展定制芯片應用場景

【環球網科技綜合報道】3月6日消息，據彭博社報道，Meta公司首席財務官蘇珊·李近日在摩根士丹利舉辦的科技會議上透露，公司已與全球頂尖芯片制造商達成重要合作協議，在采購芯片滿足當下人工智能業務需求的同時，正…

03-07

雷軍兩會談科技創新：人形機器人將進廠，小米未來五年豪擲2000億研發

會上，全國人大代表、小米集團創始人雷軍說，人形機器人已在小米汽車工廠中開始實習，將為推動人形機器人在智能制造領域的應用持續貢獻力量。第二，要堅持技術為本，堅持投入硬核科技創新，持續深耕關鍵領域的核心技術。…

03-07

雷軍談中國AI：人才與數據優勢助力，人形機器人加速邁向實用化

今年的《政府工作報告》說，我國人工智能等研發應用走在世界前列。全國人大代表、小米集團創始人雷軍3月5日在接受總臺記者專訪時表示，中國在人工智能領域有人才的優勢，基于整體制造業基礎和大量數據做支撐，通過不斷創…

03-07

京東曹鵬兩會建言：以國家級算力網破“孤島”，用“算力券”賦能AI普惠

曹鵬向時代財經表示，目前智能體已從單點應用走向規模化普及，成為企業運營的重要生產力；同時，AI與終端深度融合，具身智能、智能終端進入量產落地階段；此外，行業普遍放棄了純粹的技術炫技，轉向以效能與產業價值為核心…

03-07

智能眼鏡用戶成透明人：上廁所、親熱畫面全曝光

03-07

IDC：中國手機市場邁入2億像素攝像頭普及階段

03-07

字節跳動啟動最大規模轉正實習生招聘：擬招超7000人

03-07

三星為什么要費大力氣做防窺屏：背后原因揭開

03-07

蘋果M5 Max芯片Geekbench跑分曝光：單核超銳龍9 9950X3D，多核高于M3 Ultra

03-07

Meta雙管齊下：采購芯片保障當下AI業務，自研定制芯片拓展未來布局

【環球網科技綜合報道】3月6日消息，據彭博社報道，Meta公司首席財務官蘇珊·李近日在摩根士丹利舉辦的科技會議上透露，公司已與全球頂尖芯片制造商達成重要合作協議，在采購芯片滿足當下人工智能業務需求的同時，正…

03-07

雷軍談中國AI：人才數據筑基，小米機器人“實習”助力智能制造突破

今年的《政府工作報告》說，我國人工智能等研發應用走在世界前列。全國人大代表、小米集團創始人雷軍3月5日在接受總臺記者專訪時表示，中國在人工智能領域有人才的優勢，基于整體制造業基礎和大量數據做支撐，通過不斷創…

03-07

小米Xiaomi miclaw啟動小范圍封測智能交互新體驗即將來襲

據介紹，Xiaomimiclaw是基于小米MiMo大模型構建的AI交互測試產品，它的能力來自四個層次：系統底層能力、個人上下文理解、生態互聯、自進化。官方表示，它能讓手機成為AI的工具，在理解你的意圖和…

03-07

雷軍：人形機器人將進廠實習，小米未來五年加碼2000億搞創新

會上，全國人大代表、小米集團創始人雷軍說，人形機器人已在小米汽車工廠中開始實習，將為推動人形機器人在智能制造領域的應用持續貢獻力量。第二，要堅持技術為本，堅持投入硬核科技創新，持續深耕關鍵領域的核心技術。…

03-07

點擊查看更多 +

全站最新

北汽極狐問道V9二季度上市獲央廣網青睞成兩會高端訪談專用車

北汽極狐問道V9成兩會訪談專用車豪華中大型MPV二季度將上市

新一代小米SU7官宣預售22.99萬起，砂陶米內飾亮相，配置升級亮點多

小米汽車新一代SU7內飾上新！砂陶米配色登場，智能配置升級預售價22.99萬起

小米新一代SU7實車進駐全國143城492家門店智能配置與續航能力全面升級

雷軍談未來出行：五年內限定場景迎無人駕駛，私家車全場景仍需時日

熱門內容

本欄最新

新一代小米SU7官宣預售22.99萬起，砂陶米內飾亮相，配置升級亮點多

小米汽車新一代SU7內飾上新！砂陶米配色登場，智能配置升級預售價22.99萬起

小米新一代SU7實車進駐全國143城492家門店智能配置與續航能力全面升級

雷軍談未來出行：五年內限定場景迎無人駕駛，私家車全場景仍需時日

雷軍談人形機器人：宇樹科技令人贊嘆，小米機器人已進廠實習，邀海爾周云杰共探智能制造

全國人大代表劉慶峰展望：未來五年科大訊飛行業模型將比肩人類專家

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

GPT-5.4“動手”能力大升級：微信操作驚艷，瀏覽器控制卻讓人哭笑不得