大模型競爭格局再度洗牌。根據最新發布的 Artificial Analysis 智能指數,Anthropic 的旗艦模型Claude Opus4.6憑借卓越的表現力壓群雄,正式登頂該權威排行榜。這一指數綜合了編程、代理任務和科學推理等十項深度測試,Opus4.6在代理類工作任務、終端編程以及物理研究課題上均斬獲第一。
值得關注的是,盡管 Opus4.6的運行成本高達2,486美元,略高于 OpenAIGPT-5.2的2,304美元,但在效率表現上卻呈現出顯著差異。數據顯示,Opus4.6在測試過程中消耗了約5,800萬個輸出 Token,雖然這一數字是前代機型4.5的兩倍,但相較于 GPT-5.2驚人的1.3億個 Token,Opus4.6顯然在信息密度和處理邏輯上更為精簡。目前,該模型已全面上線Claude.ai平臺,并支持通過 Google Vertex、AWS Bedrock 等主流云服務進行調用。
然而,Anthropic 的領先地位正面臨嚴峻挑戰。行業巨頭 OpenAI 的新一代編程利器Codex5.3已在備測名單中。分析人士指出,一旦 Codex5.3完成所有基準測試,其在代碼編寫及相關邏輯領域的優勢極有可能助其重奪王座。這場“全球最聰明模型”的拉鋸戰,遠未到蓋棺論定的時候。











