滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

性能接近旗艦成本直降，Anthropic中檔模型Sonnet 4.6重塑AI應用格局

時間：2026-02-20 16:34:28 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

Anthropic公司近日推出中檔AI模型Claude Sonnet 4.6，在保持與前代相同定價策略的同時，實現了性能的顯著提升。該模型每百萬token輸入定價3美元、輸出15美元，卻能在多項基準測試中比肩甚至超越價格高出五倍的旗艦產品Opus 4.6，引發行業廣泛關注。

在真實軟件編碼能力測試SWE-bench Verified中，Sonnet 4.6以79.6%的得分緊追Opus 4.6的80.8%，同時領先OpenAI的GPT-5.2。在代理式金融分析任務中，該模型以63.3%的準確率超越所有競爭對手，包括Opus 4.6的60.1%和GPT-5.2的59.0%。辦公任務評估GDPval-AA Elo評分顯示，Sonnet 4.6以1633分超越Opus 4.6的1606分和GPT-5.2的1462分。

盡管在終端編碼任務Terminal-Bench 2.0、代理式搜索BrowseComp和新穎問題解決測試ARC-AGI-2等高復雜度領域，Opus 4.6仍保持領先優勢，但Sonnet 4.6在計算機使用能力方面展現出突破性進展。OSWorld-Verified基準測試中，該模型得分72.5%，較前代提升11.1個百分點，遠超GPT-5.2的38.2%。這種能力使AI能夠通過模擬人類操作完成復雜任務，為企業應用開辟了新場景。

保險科技公司Pace的測試顯示，Sonnet 4.6在其保險計算機使用基準測試中達到94%的準確率，創下Claude系列模型新高。該模型還具備自我糾正能力，能夠分析失敗原因并調整策略。在安全防護方面，Sonnet 4.6對提示注入攻擊的抵御能力較前代有顯著提升，這對需要處理網頁交互的企業應用至關重要。

企業用戶反饋顯示，Sonnet 4.6在保持成本優勢的同時，性能表現接近旗艦模型。數據分析平臺Hex Technologies已將大部分流量遷移至該模型，其CTO指出，通過自適應思考和高努力模式配置，除最困難的分析任務外，其他工作均達到Opus級別性能。云存儲公司Box的測試表明，Sonnet 4.6在真實企業文檔處理中的表現較前代提升15個百分點。

該模型配備100萬token的超長上下文窗口，可處理完整代碼庫或法律文件等大型文檔。在Vending-Bench Arena企業運營模擬測試中，Sonnet 4.6展現出戰略決策能力：前十個模擬月大量投資產能，后期轉向盈利能力提升，最終模擬余額達5700美元，較前代提升171%。

業務拓展方面，Anthropic在發布Sonnet 4.6當日宣布與印度IT巨頭Infosys達成合作，將Claude模型集成至Topaz AI平臺，服務銀行、電信和制造業客戶。同時，該公司在班加羅爾設立首個印度辦事處，目前印度市場占Claude全球使用量的6%，僅次于美國。此舉引發資本市場波動，部分軟件企業股價出現調整。

為降低開發者使用門檻，Anthropic將免費層級默認升級至Sonnet 4.6，開發者可通過Claude API直接調用該模型。這一策略可能進一步改變AI市場競爭格局，特別是對成本敏感的企業用戶產生顯著影響。

更多>同類資訊

英偉達將向OpenAI投資300億美元

02-20

英偉達300億美元投資OpenAI，新融資或本周末完成且資金將再投硬件

02-20

科技賦能春運新圖景：智慧加能站助力返鄉路高效暖心共赴團圓

02-20

馬年春節前公募調研忙不停機器人半導體及有色金屬成布局熱點

02-20

英偉達擬斥資300億美元投資OpenAI，取代千億美元合作計劃

02-20

OpenAI有望拿到1000億美元，但也快被逼到墻角了

02-20

英偉達將向OpenAI投資300億美元

02-20

奧爾特曼：超級智能將超越人類CEO與頂尖科學家

02-20

春晚機器人大秀黑科技：從運動控制到家務場景，科技感拉滿！

這些機器人在節目中進行了高難度的后空翻和側手翻，配合演員完成了互動劇情。期間，宇樹科技的G1機器人是表演主力，后空翻、側翻、馬步等高難度動作不在話下，與武術學校的小朋友們展開“人機對決”，雙方對練棍術、耍…

02-20

春晚機器人“四強”齊亮相松延動力攜手山大宇樹科技落地青島共譜新篇

據經濟導報記者了解，2025年11月，青島城市學院在“具身智能產學研融合生態大會”上成立了“具身智能產學研融合青島基地”，與越疆科技、宇樹科技、上海信弘、零次方機器人、松靈機器人、艾歐智能、廣州視源七家具身…

02-20

AI領域再掀熱潮！李飛飛初創World Labs獲10億美元融資英偉達AMD等參投

02-20

英飛凌布局人形機器人芯片領域，借技術協同優勢搶占市場先機

02-20

OpenAI或獲千億美元融資，商業化加速背后挑戰與危機并存

02-20

印度AI領域投資熱潮涌動：信實攜Jio豪擲10萬億盧比布局未來

02-20

DuckDuckGo推出AI圖像編輯功能免注冊限額免費使用且隱私有保障

02-20

點擊查看更多 +

全站最新

智譜飆升37%，再創歷史新高，市值突破3000億港元

2027款梅賽德斯-AMG CLE敞篷改款路測現身 V8引擎回歸動力或超600馬力

從愛多興衰看合作之道：學任正非“合作共贏”，借強者之力謀企業發展

歸鄉記 | 最怕的人是自己

港股異動丨高盛升目標價！部分本地地產股走強，恒基地產漲超3%

春晚機器人，又一場盛大的資本造勢

熱門內容

本欄最新

科技賦能春運新圖景：智慧加能站助力返鄉路高效暖心共赴團圓

蘇州制造企業如何選畫冊設計機構？看懂大廠案例背后的專業邏輯

春晚舞臺上的“魔法時刻”：具身智能落地，機器人開啟真實服務新篇

探秘未來汽車“智慧能源大腦”：整車智能能量管理控制全解析

零跑D99豪華MPV來襲：算力續航雙強，或成北方電車用戶福音

2026年具身智能分水嶺：松延動力激進沖刺，開啟機器人規模化新篇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

性能接近旗艦成本直降，Anthropic中檔模型Sonnet 4.6重塑AI應用格局