一場意外的權限配置錯誤,讓AI公司Anthropic陷入了一場前所未有的風波。這家以安全著稱的企業,竟因內部系統疏忽,將尚未發布的新模型信息公之于眾,引發了科技圈的廣泛關注。
據透露,此次泄露源于Anthropic內容管理系統在版本遷移時的一次致命失誤。一個存儲公司核心資產的數據庫權限被錯誤地從內部私有設置為完全公開,導致大量未加密的內部文件在互聯網上“裸奔”。這些文件包括3000份保密資產檔案,其中不乏關于新模型的詳細信息。
劍橋大學研究員與網絡安全公司LayerX Security在掃描過程中偶然發現了這一漏洞,并從中獲取了關于Anthropic正在測試的秘密模型——Claude Mythos的驚人細節。有網友在下架前保存了相關博客草稿,發現該模型被同時稱為Mythos和Capybara,內容基本一致。
泄露文件顯示,Claude Mythos在性能上實現了質的飛躍,甚至超越了Anthropic當前最強的Opus模型。在軟件編碼、學術推理和網絡安全等測試中,Mythos的得分顯著高于Opus 4.6。文件還明確指出,Mythos是Anthropic迄今為止開發的最強大AI模型。
這一消息在科技圈引起了軒然大波。要知道,Opus 4.6作為Anthropic的旗艦模型,在復雜長文本處理和推理能力上已處于行業領先地位。其在GDPval-AA指標上的表現甚至超越了GPT-5.2。如果Mythos真的如文件所述那般強大,那么AI領域的競爭格局或將因此發生巨變。
面對泄露事件,Anthropic發言人承認了錯誤,并表示公司正在開發一款通用模型,在推理、編碼和網絡安全方面有顯著提升。由于該模型能力強大,公司正在謹慎發布,并與少數早期用戶合作測試。Anthropic還強調,分階段披露是為了給網絡防御組織留出準備時間,以應對未來可能出現的AI攻擊。
然而,這一解釋并未完全平息外界的擔憂。有專家指出,Mythos在代碼和網絡安全領域的能力遠超現有水平,一旦被惡意利用,可能引發大規模網絡攻擊。因此,有人呼吁這樣的模型根本不應公開,因為不存在絕對安全的防御系統。
事實上,即使是當前的Opus 4.6,也已具備發現生產代碼庫中未知漏洞的能力。Anthropic承認,這項功能具有雙重用途,既可用于防御,也可能被黑客利用。這意味著,無論是Anthropic還是OpenAI等公司,其最新一代模型都已突破了某個門檻,帶來了新的網絡安全挑戰。
盡管泄露的信息可能存在炒作成分,但這一事件無疑為AI行業敲響了警鐘。在追求模型性能的同時,如何確保安全可控,將成為所有AI企業必須面對的重要課題。











