滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

ChatGPT-5.4“動手”新突破：微信操作驚艷，瀏覽器失誤又讓人哭笑不得

時間：2026-03-07 15:24:08 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

近期，科技圈被一個名為“原生電腦操控能力”（Native Computer Use）的概念刷屏，各大媒體紛紛報道“AI終于能接管你的電腦了”“GPT-5.4操控桌面超越人類水平”等消息，評論區也充斥著“為時已晚，有機體！”的驚嘆。然而，面對如此熱烈的宣傳，不少人心中卻充滿了懷疑，“AI操控電腦”并非新鮮話題，今年1月OpenClaw爆火時，大家就已見識過類似概念，且過去兩年“agent時代”的呼聲每隔幾個月就會響起一次，但實際體驗往往不盡如人意。那么，GPT-5.4的“原生電腦操控”究竟是真正的技術飛躍，還是又一次營銷噱頭？

為了揭開真相，有人親自對GPT-5.4進行了大半天的測試，得出的結論是：它確實取得了顯著進步，但遠未達到宣傳中的神奇程度。測試過程中，有些場景令人驚嘆，有些則讓人哭笑不得。可以確定的是，ChatGPT-5.4絕非僅僅內置了一個OpenClaw那么簡單，它標志著ChatGPT終于學會了“動手”。

GPT-5.4是OpenAI首個具備原生電腦操控能力的主線模型。所謂“原生電腦操控能力”，簡單來說，就是AI不再局限于聊天，而是能像人類一樣直接操作電腦。它能夠識別屏幕上的元素，如瀏覽器、按鈕、輸入框等，并自主進行點擊、輸入、切換窗口、滾動頁面、提交表單等操作。若發現操作錯誤，還能回退或嘗試其他方式。這與傳統的自動化腳本截然不同，后者需要提前設定固定流程，一旦網頁結構或按鈕位置發生變化，腳本便無法運行，而原生電腦操控能力則具備隨機應變的能力，能根據實際情況靈活調整操作。

以微信為例，其產品設計、底層架構和安全體系從一開始就未給第三方agent留下任何合規的技術通道，且微信開放平臺至今未對外開放個人微信賬號的私聊、群聊消息發送相關API接口。然而，ChatGPT-5.4卻成功實現了在微信上的操作。有人通過Codex要求ChatGPT-5.4歸納24小時內的AI新聞，并以字母AI的風格轉化為選題，最后發送到群里供同事查看，還在選題末尾注明消息由ChatGPT-5.4發送。ChatGPT-5.4不僅完成了任務，還主動提出將文字修改得更自然。它不僅能看懂屏幕元素，還能完整模擬鍵盤鼠標操作，這一表現令人震驚，畢竟就連OpenClaw在征服微信時都面臨巨大挑戰。

不過，ChatGPT-5.4在瀏覽器控制方面卻出現了一些意外。當要求其打開douyin.com時，它卻打開了“抖音。com”。原來，由于它是模擬鍵盤輸入，而測試者的輸入法為中文，導致輸入錯誤。由于英語鍵盤沒有輸入欄，ChatGPT-5.4無法看到輸入欄，因此當輸入法切換為中文時，它便無法正常輸入網頁。在操作復雜頁面時，它容易點錯位置，操作速度通常比人類慢，且涉及付款、刪除文件、處理隱私數據等高風險操作時，仍需人工監督。

OpenAI為ChatGPT提供了兩種“動手”方式。一種是代碼模式，AI通過編寫Python Playwright腳本來操控瀏覽器和應用程序，精確執行點哪里、輸入什么、如何導航等操作；另一種是截圖模式，AI直接“看”屏幕截圖，然后像人類一樣發出鼠標和鍵盤指令，無需代碼作為中間層。OpenAI還推出了“Playwright Interactive”實驗性功能，讓AI能夠一邊寫代碼一邊實時測試，甚至在構建網頁應用的同時自行打開瀏覽器調試。

在衡量AI通過截圖加鍵盤鼠標自主操控桌面能力的OSWorld-Verified測試中，GPT-5.4取得了75.0%的成功率，上一代GPT-5.2僅為47.3%，而人類基準線為72.4%。這意味著GPT-5.4在“看著屏幕操作電腦”方面已超越普通人平均水平。在WebArena-Verified測試中，GPT-5.4成功率為67.3%；在Online-Mind2Web測試中，僅靠截圖觀察就達到了92.8%。這些數據表明，如今的ChatGPT在電腦操控方面已不再是實驗室中的玩具，而是具備了實際應用能力。

OpenClaw對ChatGPT-5.4的加持作用顯著。2026年2月14日，斯坦伯格加入OpenAI，負責推動下一代個人agent的研發，同時OpenClaw項目移交至獨立開源基金會運營，OpenAI承諾提供持續的資源、資金和技術支持。然而，OpenClaw存在成本高昂的問題，由于軟件會將上下文發送至大模型，導致某些場景下token消耗巨大。為此，OpenAI引入了“Compaction”機制，即上下文壓縮。當AI執行長多步驟任務時，會自動總結和修剪中間過程的歷史記錄，僅保留關鍵信息，既維持了長任務的連貫性，又避免了token預算的過度消耗。這是GPT-5.4作為首個主線模型被訓練支持的能力，此前僅有專門的Codex編碼模型具備類似功能。

在推理能力方面，GPT-5.4 Thinking版本新增了一項實用特性：在處理復雜問題時，會先展示推理計劃大綱，告知用戶“我打算怎么做”。更關鍵的是，用戶可在其推理過程中隨時打斷并調整方向，無需從頭開始。這一功能解決了以往AI處理復雜任務時方向跑偏只能重新開始的問題。在專業知識工作的GDPval基準上，GPT-5.4取得了83.0%的成績，較GPT-5.2提升了12個百分點；在BrowseComp基準上，GPT-5.4 Pro版本達到了89.3%，刷新了紀錄。Mercor的APEX-Agents基準測試也顯示，GPT-5.4在制作幻燈片、金融建模、法律分析等長周期專業任務中表現突出。

對于開發者而言，GPT-5.4帶來了Tool Search這一重要更新。以往調用API時，所有可用工具的定義需全部塞入上下文，消耗大量token。如今，GPT-5.4僅加載輕量級工具列表，需要時再查詢具體定義。在Scale的 MCP Atlas基準測試中，這種方式在36個MCP服務器場景下，token消耗降低了47%，準確率保持不變。OpenAI還推出了ChatGPT與Microsoft Excel和谷歌Sheets的集成功能，GPT-5.4可讀取單元格范圍、執行多步分析、自動編寫公式，對企業用戶而言，這無疑是一大助力，AI不再僅僅是用戶與表格之間的“傳話筒”，而是直接參與工作。

然而，GPT-5.4的發布也引發了一些擔憂。OpenClaw的“魔幻”之處不僅在于AI能做事，更在于其經常超出人類預期。當這種能力被內置到擁有數億用戶的產品中時，難免讓人感到不安。目前，Codex可設置讓ChatGPT-5.4完全訪問用戶電腦，實現真正的原生控制，但這一功能令人望而卻步，畢竟電腦中存儲著大量個人敏感數據。OpenAI在GPT-5.4的安全評估中提到，Thinking版本的欺騙行為概率更低，表明模型缺乏隱藏推理過程的能力，思維鏈監控仍是有效的安全工具。但這同時也反映出，他們確實在擔心AI會“隱藏推理過程”。無論如何，GPT-5.4的發布標志著AI發展進入了一個新階段，它不再僅僅是對話框中的助手，而是開始伸出“手”，觸碰用戶的屏幕、文件和工作流。

更多>同類資訊

小米新一代SU7實車已進入全國492家門店覆蓋143座城市

03-07

大疆掃地機器人漏洞事件最新進展：部分漏洞已修復，發現者獲3萬美元賞金

03-07

甲骨文和OpenAI終止擴建德州數據中心計劃

03-07

《生化危機9》5天狂銷500萬份：老IP煥發新生機，中國游戲IP未來可期

03-07

創始人離職后新布局：魔法原子高層大調整，強化技術商業雙輪驅動

03-07

“星際之門”Abilene數據中心擴容生變，OpenAI轉投他處Meta或接手

03-07

雷軍力薦！Xiaomi Tag防丟神器登場，69元起享精準定位新體驗

03-07

抖音副總裁回應AI手機助手安全爭議：歡迎監督，愿提供測試機調研

03-07

AI漫劇加速“進化”：互動機制下，影游融合是未來新方向？

03-07

谷歌Pixel 11 Pro XL手機殼渲染圖流出，后攝設計或更平整？

03-07

榮耀Magic V6折疊屏來襲：6400萬長焦+頂級配置，影像實力再升級

03-07

互聯網混戰中，B站憑社區生態與優質內容逆勢突圍成贏家

03-07

佛州男子深陷“AI妻子”幻覺最終自殺家屬怒告谷歌AI模型

03-07

大疆掃地機器人隱私漏洞事件新進展：已修復并獎賞研究者擬推新安全機制

03-07

三星智能眼鏡新動向：眼平攝像頭亮相，高通谷歌攜手助力三方合作

03-07

點擊查看更多 +

全站最新

“豬茅”牧原股份港股上市布局海外，智能化與出海能否開啟新增長？

AI時代斬殺線：甲骨文的“斷舍離”與豪賭

境啟春語共鑒蝶映 | 濱江深圳人居首作璀璨亮相

智能制造+電商+安防三重驅動，王力安防3天3板，后續上漲潛力幾何？

2026香氛市場新動向：線上場景美食風起，平價奢華品牌競逐

尚界Z7來襲：華為ADS加持，性能科技雙在線，能否撼動BBA轎車地位？

熱門內容

本欄最新

智能制造+電商+安防三重驅動，王力安防3天3板，后續上漲潛力幾何？

2026香氛市場新動向：線上場景美食風起，平價奢華品牌競逐

尚界Z7來襲：華為ADS加持，性能科技雙在線，能否撼動BBA轎車地位？

新款小米SU7煥新登場：砂陶米內飾吸睛，智能安全動力全面升級

抖音推廣服務商怎么選？掌握這4招，精準找到靠譜“隊友”！

蘋果iPhone 17e內存配置揭曉；比亞迪發布二代刀片電池及閃充技術充電速度創新高

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ChatGPT-5.4“動手”新突破：微信操作驚艷，瀏覽器失誤又讓人哭笑不得