Anthropic 近日在 Claude Platform API 中正式推出顧問工具(Advisor Tool),為開發者帶來一種全新的混合智能模式:讓更便宜、更快的模型負責全程執行任務,而在遇到復雜決策時,自動向最強大的模型“請教”策略建議。這一設計徹底顛覆了傳統“大模型拆任務、小模型執行”的 Agent 構建思路,實現了真正的“性價比最優解”。
創新機制:小模型主執行,大模型當顧問
在這一新功能中,Claude Sonnet 或 Haiku擔任“執行者”角色,負責工具調用、任務處理和結果整合。只有當執行者遇到自身難以決斷的難題時,才會將當前上下文傳遞給Claude Opus作為顧問。
Opus 僅提供高水平方案、糾正方向或戰略指導,隨后立即返回執行者繼續推進。整個過程中,Opus不直接調用工具,也不向用戶輸出最終結果,全程充當隱形“軍師”。這一反向設計讓大部分 Token 消耗發生在成本更低的模型上,僅在關鍵節點才動用高階算力。
性能與成本雙贏實測
根據官方測試數據:
Sonnet + Opus 顧問在 SWE-bench 多語言版本上,相比 Sonnet 單干提升了2.7個百分點,同時每個任務的整體成本下降了11.9%。
Haiku + Opus 顧問表現更為驚人,在 BrowseComp 測試中得分從19.7% 躍升至41.2%,實現翻倍增長。雖然仍低于 Sonnet 單干水平約29%,但成本僅為 Sonnet 的15%,非常適合高并發、容忍度較高的批量場景。
這一成果充分證明:通過智能路由關鍵決策,開發者無需在“全程用 Opus 太貴”和“只用 Sonnet 不夠強”之間艱難抉擇。
使用方式極簡,一行配置即可啟用
開發者只需在 Messages API 的 tools 數組中添加類型為advisor_20260301的工具定義即可。模型切換、上下文傳遞等復雜操作全部在單個 API 請求內部自動完成,無需手動管理多次調用或額外上下文。
還可通過max_uses參數靈活控制每次請求最多咨詢顧問的次數。賬單方面,執行者與顧問的 Token 消耗將分開計費,透明可控。目前該功能處于Beta 階段,需在請求頭中添加anthropic-beta: advisor-tool-2026-03-01才能使用。
行業意義:為 Agent 開發打開新性價比大門
AIbase 認為,顧問工具的推出標志著 AI Agent 構建范式的重要演進。它讓開發者能夠以接近 Sonnet 的價格,95% 的時間享受 Sonnet 的執行效率,同時在5% 的關鍵決策節點獲得 Opus 級別的頂級判斷力。這一“執行者 + 顧問”的混合策略,不僅顯著降低了大規模部署成本,更大幅提升了中小模型在復雜任務中的可用性。
無論是構建代碼 Agent、瀏覽器自動化還是高量級數據處理場景,顧問工具都提供了一個高效、靈活且經濟的選項。Anthropic 再次用實際行動證明:模型能力的突破不僅來自參數規模,更來自架構與使用模式的創新。
隨著 Beta 階段的推進,預計這一功能將快速成為開發者構建高性價比 AI Agent 的標配工具,值得密切關注其后續更新與更多基準表現。











