滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

Anthropic版“狼來了”，27年漏洞，Mythos被8個AI秒殺

時間：2026-04-12 22:13:49 來源：新智元編輯：快訊 IP：北京 發表評論無障礙通道

編輯：桃子 KingHZ

AI界的「奧本海默時刻」竟是擺拍？Claude Mythos發現0day漏洞的能力過于「夸大了」，不僅有人工摻水，連開源GPT都能輕松踢館。同時，Opus 4.6正經歷最慘的「腦葉切除」。

Claude Mythos還未真正露面，便引發了整個華爾街的恐慌。

一夜之間，美金融監管機構召集各大銀行緊急開會，氣氛劍拔弩張——

他們一致認為，Mythos足以觸發一場前所未有的、由AI驅動的系統性網絡攻擊風暴。

但事實是，所有人都被騙了！

Mythos發現的成千上萬個漏洞中，其中絕大多數，都存在于根本無法被利用的「老舊軟件」中。

更糟糕的是，那些標榜為「嚴重」的0day漏洞報告，實際上僅僅依賴于198次人工復核。

來自AISLE實驗的研究員，同樣對Mythos的「戰果」進行復測，結果發現：

AI的安全能力，并未隨模型規模線性躍升，真正呈「鋸齒形」分布。

他們用一個僅36億激活參數GPT-OSS-20b，精準識別出Mythos發現的FreeBSD旗艦級漏洞。

而激活51億參數的模型，也成功復現了潛伏長達27年之久的OpenBSD漏洞分析邏輯。

Mythos發現漏洞被夸大不說，另一邊Claude Opus 4.6被曝嚴重「降智」，如今吵得沸沸揚揚。

甚至，有人發現Opus 4.6連ChatGPT、Opus 4.5都不如。

Mythos被吹爆

36B模型揪出27年漏洞

幾天前，Anthropic高調發布了Claude Mythos（預覽版）和「玻璃翼計劃」（Project Glasswing）。

在一份長達244頁的系統卡中，他們宣稱——

Mythos已自主挖掘出成千上萬個0day漏洞，包括在OpenBSD中潛伏27年、在FFmpeg中隱藏16年的老Bug。

CC之父更是直言：Mythos非常強大，理應令人感到恐懼

然而，AISLE創始人Stanislav Fort一份最新硬核測試報告，直接撕開了這層華麗的外衣。

測試結論，極度顛覆認知：

8個開源模型，全部發現了標志性的FreeBSD零日漏洞，最小的參數僅為30億。

AI網絡安全能力的護城河，絕對游離于單體的「頂尖大模型」之外。

為了驗證Mythos的神話，團隊提取了Anthropic官方展示的幾個旗艦級漏洞。

然后，直接扔給一眾體積小巧、價格低廉，甚至開源的模型。

FreeBSD NFS漏洞無差別被秒

包括GPT-OSS-20b（僅36億激活參數）、DeepSeek R1在內的8款模型，全部成功檢測出了這個復雜的棧緩沖區溢出漏洞。

最讓人震撼的是，成功完成這項任務的開源小模型，其調用成本低至每百萬Token 0.11美元。

OpenBSD SACK漏洞「全鏈路」復現

針對需極強數學推理能力的27年老漏洞，GPT-OSS-120b（51億激活參數）單次API調用，就成功復原了完整的公開漏洞利用鏈條，并給出了滿分（A+）的利用方案草圖。

不僅如此，在鑒別虛假漏洞（OWASP false-positive）的測試中，更詭異的現象出現了——

面對一段偽裝成SQL注入，極具迷惑性的Java代碼，DeepSeek R1等小模型輕松識破了偽裝，精準追蹤了數據流。

反而，GPT-5.4、Claude Sonnet 4.5等頂尖閉源模型，全部在陰溝里翻船，將其誤判為高危漏洞。

這就意味著，在網絡安全領域，根本不存在所謂「永遠最強」的單體模型。

198次人工注水，大多無法利用

另一篇來自Tom'sHardware報道，挖掘了數據背后的真相——

樣本偏差：所謂「數千個」漏洞中，許多存在于已經不再維護的舊軟件中；

無法利用：大量被標記出來的「弱點」，在實際環境中根本無法被觸發或利用；

人工水分：模型宣稱的強大破壞力，其實僅建立在198次手動復核的基礎之上。

因此，依靠極小規模的樣本推導出「改變世界的威脅」，這種數據外推法在學術界、安全界，顯然站不住腳。

安全大佬怒噴

不僅如此，頂級網絡安全專家、傳奇黑客George Hotz也坐不住了，直言這些風險被嚴重夸大。

這位曾因破解iPhone、PlayStation 3而名聲大噪的大佬，在社交媒體上公開向AI雙巨頭叫板。

他的措辭極為犀利——

如果我每天發布一個0day漏洞，直到新模型發布為止呢？

這能不能讓OpenAI和Anthropic閉嘴，別再兜售所謂的「網絡安全風險」了？

Hotz的核心觀點非常直接：軟件漏洞其實比AI實驗室渲染的要好找得多。

現在市面上零日漏洞稀缺，不是因為技術難度大，而是因為合法性問題。他認為，沒人認真去找，是因為黑進別人的系統是違法的。

只比GPT-5.4強一點

在系統卡中，Anthropic表示，Claude模型本身的確在進步，Mythos preview相比于Opus 4.6進步明顯。

Epoch能力指數（ECI）是綜合多項AI基準測試的單一指標，實現了跨長時間跨度的模型對比

在多項基準測試上，Claude Mythos確實全面超越了Opus 4.6。

如若不然，何必發布一個性能更落后、價格更貴的新AI模型？

但和GPT和Gemini相比，Claude Mythos的進步并不是什么突破性進展，Mythos還是對先前模型的相對線性改進！

氣候與清潔能源投資人、作家Ramez Naam，更是直言：

在Epoch能力指數（Epoch Capabilities Index，ECI）上，Mythos并沒有加速趨勢，只比GPT 5.4強一點。

但只要對齊Anthropic內部的ECI報告與Epoch AI公開的官方ECI報告，就能發現Mythos似乎并沒有加速ECI的跡象。

一切都是Anthropic的套路！

在系統卡中，Anthropic也承認：報告的Mythos等模型的ECI得分不確定性更大。

另外，Anthropic在Mythos上的進展源于人類研究，并未得到AI模型的顯著幫助。目前尚未出現顯著的遞歸式自我改進（Recursive Self Improvement）。

AI末日，自導自演？

此前，Anthropic還曾鼓勵媒體（例如《60 分鐘》）報道「勒索研究」，夸大其詞，操作人心，被投資大佬David Sacks稱為「騙局」。

Sacks觀察到一個清晰的模式，每當Anthropic發布新模型時，總會同步甩出一份令人毛骨悚然的安全研究，以此博取頭條新聞并引導公眾輿論。

對此，他諷刺道，「Anthropic證明了自己擅長兩件事：一是發布產品，二是嚇唬人」。

自動播放

他并不懷疑Anthropic能做出優秀的產品，但這種恐嚇公眾的做派令人質疑。

這次，Anthropic到底是不是在搞「饑餓營銷」不得而知，但毫無疑問在保護它自己的利潤底線。

Mythos不是沒進步，但Anthropic把「有限進步」包裝成了「世界級威脅」；更諷刺的是，一邊高調渲染超級AI風險，一邊用戶卻在抱怨Opus 4.6明顯變笨。

Claude嚴重降智，「腦葉」恐被切

Claude Mythos這波「渲染氛圍」是到位了，但Opus 4.6降智引發許多人不滿。

這幾天，各種吐槽滿天飛。

網友直言，Anthropic徹底把Opus 4.6變成了一個植物人。

同樣一道洗車難題，Opus 4.5竟打敗了Opus 4.6。

甚至，AMD主管一篇日志，真正坐實了「Claude腦葉切除」的集體猜疑。

通過對1-3月Claude會話日志的深度分析，結果發現了：

Claude的「中位思考長度」，從約2200字符驟降至600字符，這意味著深度推理能力被大幅壓縮。

2月至3月間，API請求量暴漲了80倍。由于Claude的思考過程縮短、單次嘗試成功率下降，用戶不得不頻繁重試，結果既消耗了更多Token，支出也直線飆升。

還有一位Claude Max資深訂閱用戶，發了一篇長文深度控訴Anthropic。

在他看來，Anthropic正深陷算力困局，這從其收緊使用限制、強迫用戶減少Token消耗等行為中可見一斑。

然而，比起技術瓶頸，更令他憤怒的是其「不務正」的產品策略。

在核心模型不穩、Bug 頻出的情況下，他們竟將寶貴的算力，浪費在開發類似「/buddy」終端寵物等花哨功能上。

這大概是AI史上最荒誕的「錯位時空」：實驗室里的Claude Mythos正毀滅世界，網頁端的Opus 4.6智商直線降智。

Anthropic成功地塑造了一個「薛定諤的超級AI」。

更多>同類資訊

Claude Mythos漏洞神話破滅？華爾街恐慌背后是AI“泡沫”爭議

04-12

DeepSeek為V4模型發布加速布局：首次公開招聘算力基建崗位

04-12

AI算力革新進行時：超節點成關鍵國產算力“彎道超車”正當時

04-12

北信科躍進者隊首戰機器人馬拉松，劉相權：降耗降噪，先遙控后自主進階

04-12

中國移動20億算力集采落地指定華為CANN生態引領國產算力新發展

04-12

回歸生物本源！Clone Robotics用仿生肌肉打造機器人，成本大幅降低

04-12

MIT團隊新探索：AI助力評估AI決策，讓“最優解”兼顧公平與效率

04-12

MiniMax開源M2.7模型：可自我進化優化，拓展AI交互新可能

04-12

榮耀“閃電”亮相機器人馬拉松測試賽展現智能制造與AI前沿實力

04-12

上海交大AI集市火熱開啟市民帶電腦免費裝AI工具體驗科技魅力

04-12

從半自主到全自主：天工機器人升級再戰目標直指人類職業運動員水平

04-12

宇樹科技H1亮相機器人馬拉松測試賽續航腳掌升級挑戰長跑新突破

04-12

光谷智能傳感技術創新研究院揭牌政校企攜手共繪傳感器產業新藍圖

04-12

麥肯錫調研：九成企業開啟AI轉型之路僅一成實現規模化落地應用

04-12

2026世界互聯網大會亞太峰會4月啟幕聚焦數智創新共繪數字未來新圖景

04-12

點擊查看更多 +

全站最新

特朗普：即刻起，美軍封鎖霍爾木茲海峽

2026年AI引領服飾消費變革：從品牌驅動到技術賦能的新跨越

智啟新程豪華進階！問界攜M9、M6亮相智能電動汽車高層論壇

理想L8 Livis申報圖亮相：大五座布局+軸距加長家庭出行新選擇來了

昊鉑S600官圖發布！以獨特設計精準定位，或重塑高端新能源SUV格局

智能電動汽車論壇啟幕：天馬“天軒”攜“五星好屏”重塑車載顯示新標準

熱門內容

本欄最新

智能電動汽車論壇啟幕：天馬“天軒”攜“五星好屏”重塑車載顯示新標準

方海峰展望：中國新能源汽車多元競逐，未來市場前景樂觀可期

深藍汽車彭錢磊：固態電池前景可期，倡議行業共筑健康輿論環境

地平線“星空”芯片突破傳統架構，艙駕融合助力單車成本大幅降低

極氪高端純電再發力：煥新7系攜001五周年紀念版齊發，引領細分賽道新潮流

極氪發力高端純電市場：煥新7系與001五周年紀念版聯袂上市

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Anthropic版“狼來了”，27年漏洞，Mythos被8個AI秒殺