2 月 8 日消息,Claude Code 推出快速模式(Fast mode)研究預(yù)覽版。該模式通過優(yōu)化 Opus 4.6 的 API 配置,在保持模型質(zhì)量不變的前提下顯著降低響應(yīng)延遲。
官方稱,快速模式并非獨(dú)立模型,其仍使用相同的 Opus 4.6 模型,僅采用不同的 API 配置,優(yōu)先保障速度而非成本效益。響應(yīng)質(zhì)量與功能完全一致,僅響應(yīng)速度更快。
Fast mode 適用于 Pro、Team 等訂閱用戶及 Console 用戶,需通過“額外用量”計(jì)費(fèi)。第三方提供商 Amazon Bedrock、Google Vertex AI 和 Microsoft Azure Foundry 均不支持快速模式。
目前該模式定價(jià)為每百萬 Token 輸入 30 美元、輸出 150 美元。太平洋時(shí)間 2 月 16 日晚上 11:59 前,所有方案均可享受 50% 的限時(shí)折扣。
此前報(bào)道,2 月 6 日 Anthropic 發(fā)布了新一代 Claude Opus 4.6 模型,支持 200K 上下文窗口(測試版提供 100 萬 token),最大輸出 token 數(shù)提升至 128K,較前代 64K 限制翻倍。該模型引入自適應(yīng)思考模式,可根據(jù)問題復(fù)雜度動(dòng)態(tài)調(diào)整思考深度,并新增最高級別的 max effort 參數(shù)。新版本還推出上下文壓縮功能,當(dāng)對話接近窗口限制時(shí)自動(dòng)總結(jié)早期內(nèi)容,實(shí)現(xiàn)近乎無限長度的對話。







