2 月 14 日消息,OpenAI 于 2026 年 2 月 13 日發布公告,宣布為 ChatGPT 新增高級安全設置。
OpenAI 表示,隨著 AI 系統開始承擔更復雜的任務,尤其是涉及網頁與外部應用的場景,安全風險也隨之激增,其中一種日益凸顯的新型風險便是“提示注入”(prompt injection)。在此類攻擊中,第三方會通過提示詞誤導 AI 以使其執行惡意指令,或誘導其泄露內部敏感信息。
為幫助用戶與組織降低提示注入攻擊風險,OpenAI 宣布推出兩項新的防護措施,總結如下:
其一是 ChatGPT 的“Lockdown Mode(鎖定模式)”,這是一項面向高風險用戶的可選高級安全設置;
其二是針對部分可能引入額外風險的能力,在 ChatGPT、ChatGPT Atlas 與 Codex 中統一新增“Elevated Risk”風險標簽。
OpenAI 稱,這些新增措施建立在其現有的多層防護之上,包括沙箱機制、針對基于 URL 的數據外泄的防護、監測與執行機制,以及企業級控制功能,例如基于角色的訪問控制與審計日志等。
據介紹,鎖定模式是一項可選的高級安全設置,主要面向少量高度重視安全的用戶群體,例如大型組織的高管或安全團隊,用于提升對高級威脅的防護能力。
OpenAI 強調,大多數用戶并不需要啟用鎖定模式。其核心目標是通過嚴格限制 ChatGPT 與外部系統的交互方式,降低提示注入等攻擊導致的數據外泄風險。
OpenAI 表示,鎖定模式會以確定性方式禁用 ChatGPT 中某些可能被攻擊者利用的工具與能力,從而避免攻擊者通過提示注入等手段,將用戶對話或已連接應用中的敏感數據外傳。
作為例子,OpenAI 提到,在鎖定模式下,ChatGPT 的網頁瀏覽功能將被限制為僅訪問已緩存內容。該限制旨在防止敏感數據在瀏覽過程中被攻擊者獲取或外泄。對于某些無法提供強確定性數據安全保證的功能,鎖定模式下則會直接完全禁用。
OpenAI 同時指出,ChatGPT 的商業訂閱版本已提供企業級數據安全能力,而鎖定模式是在此基礎上的進一步增強。該模式目前適用于 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare 與 ChatGPT for Teachers。管理員可以在 Workspace Settings 中通過創建新角色來啟用鎖定模式。啟用后,鎖定模式會在現有管理員設置之上疊加額外限制。
由于部分關鍵工作內容仍依賴外部應用,OpenAI 表示 Workspace 管理員仍可獲得更細粒度的控制能力:管理員可以精確選擇哪些應用、以及這些應用內的哪些具體操作,可在鎖定模式下提供給用戶使用。
在風險標簽方面,OpenAI 表示,AI 產品在連接應用與網頁后往往更有幫助,公司也在保護連接數據安全方面投入大量工作。但與此同時,某些與網絡相關的能力會引入新的風險,而這些風險尚未被行業現有的安全與防護措施完全解決。OpenAI 認為,一部分用戶可能愿意承擔這些風險,因此重要的是讓用戶能夠自行決定是否、以及如何使用這些能力,尤其是在處理個人私密數據時。
OpenAI 表示,其做法是在產品內為可能引入額外風險的功能提供使用指引。為使這一指引更清晰、更一致,公司正在標準化對一小部分現有能力的標注方式。這些功能將以統一的“Elevated Risk”標簽呈現在 ChatGPT、ChatGPT Atlas 與 Codex 中,使用戶在不同產品中遇到同類能力時都能獲得一致提示。
OpenAI 以 Codex 舉例稱,在其編程助手產品中,開發者可以授予 Codex 網絡訪問權限,使其能夠在網頁上執行諸如查閱文檔等操作。但相關設置界面將顯示“風險提升”標簽,并提供明確說明,包括啟用后會發生哪些變化、可能引入哪些風險、以及何時適合開啟該訪問權限。











