滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

Anthropic版「狼來了」引華爾街恐慌！27年漏洞，Mythos被8個AI秒殺

時間：2026-04-12 14:27:47 來源：新智元編輯：快訊 IP：北京 發表評論無障礙通道

Claude Mythos還未真正露面，便引發了整個華爾街的恐慌。

一夜之間，美金融監管機構召集各大銀行緊急開會，氣氛劍拔弩張——

他們一致認為，Mythos足以觸發一場前所未有的、由AI驅動的系統性網絡攻擊風暴。

但事實是，所有人都被騙了！

Mythos發現的成千上萬個漏洞中，其中絕大多數，都存在于根本無法被利用的「老舊軟件」中。

更糟糕的是，那些標榜為「嚴重」的0day漏洞報告，實際上僅僅依賴于198次人工復核。

來自AISLE實驗的研究員，同樣對Mythos的「戰果」進行復測，結果發現：

AI的安全能力，并未隨模型規模線性躍升，真正呈「鋸齒形」分布。

他們用一個僅36億激活參數GPT-OSS-20b，精準識別出Mythos發現的FreeBSD旗艦級漏洞。

而激活51億參數的模型，也成功復現了潛伏長達27年之久的OpenBSD漏洞分析邏輯。

Mythos發現漏洞被夸大不說，另一邊Claude Opus 4.6被曝嚴重「降智」，如今吵得沸沸揚揚。

甚至，有人發現Opus 4.6連ChatGPT、Opus 4.5都不如。

Mythos被吹爆36B模型揪出27年漏洞

幾天前，Anthropic高調發布了Claude Mythos（預覽版）和「玻璃翼計劃」（Project Glasswing）。

在一份長達244頁的系統卡中，他們宣稱——

Mythos已自主挖掘出成千上萬個0day漏洞，包括在OpenBSD中潛伏27年、在FFmpeg中隱藏16年的老Bug。

CC之父更是直言：Mythos非常強大，理應令人感到恐懼

然而，AISLE創始人Stanislav Fort一份最新硬核測試報告，直接撕開了這層華麗的外衣。

測試結論，極度顛覆認知：

8個開源模型，全部發現了標志性的FreeBSD零日漏洞，最小的參數僅為30億。

AI網絡安全能力的護城河，絕對游離于單體的「頂尖大模型」之外。

為了驗證Mythos的神話，團隊提取了Anthropic官方展示的幾個旗艦級漏洞。

然后，直接扔給一眾體積小巧、價格低廉，甚至開源的模型。

FreeBSD NFS漏洞無差別被秒

包括GPT-OSS-20b（僅36億激活參數）、DeepSeek R1在內的8款模型，全部成功檢測出了這個復雜的棧緩沖區溢出漏洞。

最讓人震撼的是，成功完成這項任務的開源小模型，其調用成本低至每百萬Token 0.11美元。

OpenBSD SACK漏洞「全鏈路」復現

針對需極強數學推理能力的27年老漏洞，GPT-OSS-120b（51億激活參數）單次API調用，就成功復原了完整的公開漏洞利用鏈條，并給出了滿分（A+）的利用方案草圖。

不僅如此，在鑒別虛假漏洞（OWASP false-positive）的測試中，更詭異的現象出現了——

面對一段偽裝成SQL注入，極具迷惑性的Java代碼，DeepSeek R1等小模型輕松識破了偽裝，精準追蹤了數據流。

反而，GPT-5.4、Claude Sonnet 4.5等頂尖閉源模型，全部在陰溝里翻船，將其誤判為高危漏洞。

這就意味著，在網絡安全領域，根本不存在所謂「永遠最強」的單體模型。

198次人工注水，大多無法利用

另一篇來自Tom'sHardware報道，挖掘了數據背后的真相——

樣本偏差：所謂「數千個」漏洞中，許多存在于已經不再維護的舊軟件中；

無法利用：大量被標記出來的「弱點」，在實際環境中根本無法被觸發或利用；

人工水分：模型宣稱的強大破壞力，其實僅建立在198次手動復核的基礎之上。

因此，依靠極小規模的樣本推導出「改變世界的威脅」，這種數據外推法在學術界、安全界，顯然站不住腳。

安全大佬怒噴

不僅如此，頂級網絡安全專家、傳奇黑客George Hotz也坐不住了，直言這些風險被嚴重夸大。

這位曾因破解iPhone、PlayStation 3而名聲大噪的大佬，在社交媒體上公開向AI雙巨頭叫板。

他的措辭極為犀利——

如果我每天發布一個0day漏洞，直到新模型發布為止呢？

這能不能讓OpenAI和Anthropic閉嘴，別再兜售所謂的「網絡安全風險」了？

Hotz的核心觀點非常直接：軟件漏洞其實比AI實驗室渲染的要好找得多。

現在市面上零日漏洞稀缺，不是因為技術難度大，而是因為合法性問題。他認為，沒人認真去找，是因為黑進別人的系統是違法的。

只比GPT-5.4強一點

在系統卡中，Anthropic表示，Claude模型本身的確在進步，Mythos preview相比于Opus 4.6進步明顯。

Epoch能力指數（ECI）是綜合多項AI基準測試的單一指標，實現了跨長時間跨度的模型對比

在多項基準測試上，Claude Mythos確實全面超越了Opus 4.6。

如若不然，何必發布一個性能更落后、價格更貴的新AI模型？

但和GPT和Gemini相比，Claude Mythos的進步并不是什么突破性進展，Mythos還是對先前模型的相對線性改進！

氣候與清潔能源投資人、作家Ramez Naam，更是直言：

在Epoch能力指數（Epoch Capabilities Index，ECI）上，Mythos并沒有加速趨勢，只比GPT 5.4強一點。

https://epoch.ai/eci/

但只要對齊Anthropic內部的ECI報告與Epoch AI公開的官方ECI報告，就能發現Mythos似乎并沒有加速ECI的跡象。

一切都是Anthropic的套路！

在系統卡中，Anthropic也承認：報告的Mythos等模型的ECI得分不確定性更大。

另外，Anthropic在Mythos上的進展源于人類研究，并未得到AI模型的顯著幫助。目前尚未出現顯著的遞歸式自我改進（Recursive Self Improvement）。

AI末日，自導自演？

此前，Anthropic還曾鼓勵媒體（例如《60 分鐘》）報道「勒索研究」，夸大其詞，操作人心，被投資大佬David Sacks稱為「騙局」。

Sacks觀察到一個清晰的模式，每當Anthropic發布新模型時，總會同步甩出一份令人毛骨悚然的安全研究，以此博取頭條新聞并引導公眾輿論。

對此，他諷刺道，「Anthropic證明了自己擅長兩件事：一是發布產品，二是嚇唬人」。

他并不懷疑Anthropic能做出優秀的產品，但這種恐嚇公眾的做派令人質疑。

這次，Anthropic到底是不是在搞「饑餓營銷」不得而知，但毫無疑問在保護它自己的利潤底線。

Mythos不是沒進步，但Anthropic把「有限進步」包裝成了「世界級威脅」；更諷刺的是，一邊高調渲染超級AI風險，一邊用戶卻在抱怨Opus 4.6明顯變笨。

Claude嚴重降智，「腦葉」恐被切

Claude Mythos這波「渲染氛圍」是到位了，但Opus 4.6降智引發許多人不滿。

這幾天，各種吐槽滿天飛。

網友直言，Anthropic徹底把Opus 4.6變成了一個植物人。

同樣一道洗車難題，Opus 4.5竟打敗了Opus 4.6。

甚至，AMD主管一篇日志，真正坐實了「Claude腦葉切除」的集體猜疑。

通過對1-3月Claude會話日志的深度分析，結果發現了：

Claude的「中位思考長度」，從約2200字符驟降至600字符，這意味著深度推理能力被大幅壓縮。

2月至3月間，API請求量暴漲了80倍。由于Claude的思考過程縮短、單次嘗試成功率下降，用戶不得不頻繁重試，結果既消耗了更多Token，支出也直線飆升。

還有一位Claude Max資深訂閱用戶，發了一篇長文深度控訴Anthropic。

在他看來，Anthropic正深陷算力困局，這從其收緊使用限制、強迫用戶減少Token消耗等行為中可見一斑。

然而，比起技術瓶頸，更令他憤怒的是其「不務正」的產品策略。

在核心模型不穩、Bug 頻出的情況下，他們竟將寶貴的算力，浪費在開發類似「/buddy」終端寵物等花哨功能上。

這大概是AI史上最荒誕的「錯位時空」：實驗室里的Claude Mythos正毀滅世界，網頁端的Opus 4.6智商直線降智。

更多>同類資訊

靈初智能引領具身智能新突破：10萬小時數據助力，雙模型架構顯實力

04-12

AI圈新寵Hermes Agent：會學習能成長，還原生適配微信多平臺

04-12

風行肖冰漫劇大會發聲：技術迭代下漫劇行業的效率與競爭新路徑

04-12

別克至境E7 4月22日上市，16-21萬享四座懸浮座椅與城市NOA智能駕駛

04-12

特斯拉限量發售350輛Model S與X Plaid簽名版典藏設計致敬電動時代終章

04-12

OpenClaw“龍蝦”五天五版火力全開，密集迭代帶來哪些驚喜更新？

04-12

廣東人形機器人“超級工廠”：從實驗室到千家萬戶的規模化突圍之路

這是一個頗具象征意義的產業節點：中國制造業又一次將前沿高科技產品，從“實驗室珍品”鍛造成“產線常客”。人形機器人不再是停留在展臺上的炫技玩具，行業討論的核心，也從“能不能造出來”轉向“能以多快速度穩定量產”…

04-12

宇樹科技H1機器人百米測試創佳績，速度直追人類百米紀錄保持者

來源：市場資訊 4月11日，宇樹科技宣布H1機器人刷新人形機器人百米測試奔跑速度的世界紀錄。今年3月，宇樹科技創始人王興興在亞布力論壇上曾說：“今年年中，中國人形機器人百米沖刺將突破10秒大關，超越博爾特。…

04-12

AI文創風口已至！第十三屆網絡視聽大會邀您共探數字文創新機遇

4項重點活動統籌頂層設計，涵蓋開幕式、主論壇、企業座談會以及2026網絡視聽創新展交開放日，開幕式將重磅發布《中國網絡視聽發展研究報告（2026）》，啟動系列主題創作與全球播映活動；8大熱點論壇聚焦微短劇、網…

04-12

中國具身智能大會合肥啟幕安徽大學布局新學院助力產業創新發展

4月11日，中國具身智能大會在合肥舉行，會上，安徽大學宣布成立低空經濟與工程學院、機器人學院、腦機接口研究院。當前安徽正將具身智能作為推動制造業高質量發展的關鍵抓手，加快科技與產業融合創新，構建創新生態。本…

04-12

算力“心臟”的守護者：在幕后托起智能時代流暢體驗的人

中心基礎設施網絡運維工程師侯曉雯從一排排機柜前走過，目光掃過供配電柜的指示燈，又側耳聽了聽液冷系統的循環聲。如果說侯曉雯守護的是數據中心的“心肺”，那么算力網絡運維工程師趙一帆管的就是“大腦”——那些承載大…

04-12

方海峰展望：中國新能源汽車多元競逐，未來市場前景樂觀可期

04-12

一汽“九章”平臺引領變革：2026年車路云星協同，2028年全場景無人駕駛

04-12

深藍汽車彭錢磊：固態電池前景可期，倡議行業共筑健康輿論環境

04-12

國產宇樹H1機器人百米沖刺達10米每秒速度直逼人類短跑極限引熱議

04-12

點擊查看更多 +

全站最新

美伊談判無果而終！關鍵分歧曝光，特朗普暗示或采取“海上封鎖”手段！

方海峰展望：中國新能源汽車多元競逐，未來市場前景樂觀可期

徐云：極氪9X憑技術實力獲海內外認可，成中國品牌撬動全球市場利器

深藍汽車彭錢磊：2030年新能源規模或達1700萬共促行業健康發展

深藍汽車彭錢磊：固態電池前景可期，倡議行業共筑健康輿論環境

特斯拉推Plaid Model S和X簽名限量版，專屬配置拉滿致敬經典車型

熱門內容

本欄最新

方海峰展望：中國新能源汽車多元競逐，未來市場前景樂觀可期

深藍汽車彭錢磊：固態電池前景可期，倡議行業共筑健康輿論環境

地平線“星空”芯片突破傳統架構，艙駕融合助力單車成本大幅降低

極氪高端純電再發力：煥新7系攜001五周年紀念版齊發，引領細分賽道新潮流

極氪發力高端純電市場：煥新7系與001五周年紀念版聯袂上市

蔚來李斌談行業挑戰：新車迭代快致盈利難，呼吁電芯芯片標準化降本

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Anthropic版「狼來了」引華爾街恐慌！27年漏洞，Mythos被8個AI秒殺