OpenAI 毫無預兆地發布了 GPT-5.4,這款新模型首次實現了原生電腦操控能力,一經推出便引發科技圈熱議。實測顯示,GPT-5.4 幾乎可以操作電腦上的所有應用,從文件管理到程序運行,從終端操作到軟件交互,其表現令人驚嘆。
在實測中,GPT-5.4 展現出了強大的電腦操控能力。以 Macbook 為例,用戶只需發出指令,GPT-5.4 就能直接調起日歷應用,并要求系統給予相應權限,隨后在日歷中設置提醒。同樣,它還能打開小宇宙 APP,播放指定節目,甚至操作計算器進行復雜計算。無論是打開微信讀書閱讀書籍,還是更換電腦壁紙,亦或是通過終端運行代碼,GPT-5.4 都能輕松應對,真正實現了“原生電腦操控能力”。
GPT-5.4 的發布,讓 OpenClaw 這一開源個人 AI 助手項目迎來了新的發展機遇。OpenClaw 由 PSPDFKit 創始人 Peter Steinberger 開發,其核心理念是讓 AI 真正幫助用戶完成工作,而不僅僅是聊天。OpenClaw 運行在用戶電腦上,擁有對 Shell、文件系統、瀏覽器的完整訪問權限,可以通過消息指令執行終端命令、編寫腳本、管理郵件等任務。然而,OpenClaw 的性能高度依賴所使用的模型,模型的能力直接決定了其表現。
GPT-5.4 的出現,恰好解決了 OpenClaw 的痛點。作為第一個具備原生電腦使用能力的通用模型,GPT-5.4 不需要借助外部框架或適配層,就能通過截圖識別屏幕內容,發出鼠標點擊和鍵盤輸入指令,像人類一樣操作軟件。在 OSWorld-Verified 基準測試中,GPT-5.4 取得了 75.0% 的成功率,超過了普通人類用戶的平均水平(72.4%),也遠超前代模型 GPT-5.2(47.3%)。
除了原生電腦操控能力,GPT-5.4 還具備其他顯著優勢。其 100 萬 Token 的上下文窗口,讓 OpenClaw 能夠維持長對話、記住復雜指令鏈、處理大量文件內容,不再像以前那樣容易“遺忘”任務。Tool Search 機制則大幅降低了工具調用的 Token 消耗,提高了 Agent 的效率,對于 7×24 小時運行的 OpenClaw 來說,這意味著每月可節省數十甚至上百美元的 API 費用。GPT-5.4 在推理能力上的躍升,使其能夠勝任更復雜、更高價值的工作場景,從寫代碼調 Bug 到做財務分析寫投資備忘錄,應用空間廣闊。
科技界對 GPT-5.4 的評價極高。HyperWriteAI、OthersideAI 首席執行官 Matt Shumer 認為它是目前世界上最好的模型,遠超其他競爭對手,甚至在標準模式下的表現也超越了以往的專業版模型。Mercor AI 首席執行官 Brenda 則表示,GPT-5.4 即將超越頂尖咨詢公司、投行和律所的專業能力,能夠完成人類精英金領的所有工作,甚至做得更好。
GPT-5.4 的發布,標志著 AI 行業正在從對話式 AI 向智能體 AI 跨越。過去,我們關注 AI 的聰明程度、寫作能力、回答能力;現在,話題轉向了 AI 的實際能力、完成能力和替代能力。GPT-5.4 與 OpenClaw 的組合,讓個人 AI 員工從概念變為現實,開啟了 AI 應用的新時代。











