4 月 7 日消息,小米集團 MiMo 負責人羅福莉昨天在 X 平臺發文,談及最近 AI 業界火熱的 Token(注:詞元)價格戰。
圖源:羅福莉本人社媒賬號
羅福莉表示,Anthropic 幾天前切斷了 Claude 第三方工具訂閱通道;并且 MiMo 也在幾天前推出了 Token Plan,于是她有感而發:
1、Claude Code 的訂閱機制在計算資源分配上設計得非常漂亮。但我認為它并不賺錢甚至可能虧損,除非 API 利潤率高出 10 到 20 倍。
我無法精確計算第三方框架接入后帶來的損失,但我仔細研究 OpenClaw 的上下文管理后發現它很糟糕。例如在一次用戶請求中,OpenClaw 會觸發多輪低價值的工具調用,每一次都是獨立的 API 請求,而且都攜帶超長上下文(通常超過 10 萬 tokens)。
即便有緩存命中,這種方式仍然非常浪費;在極端情況下,還會提高其他請求的緩存未命中率。
這就導致每個用戶實際觸發的 API 調用次數往往是 Claude Code 原生框架的數倍。換算成 API 成本很可能是訂閱價格的幾十倍。這已經不是“差距”,而是“巨大鴻溝”。
2、OpenClaw、OpenCode 等第三方框架仍然可以通過 API 調用 Claude,只不過不能再“搭便車”使用訂閱額度。
短期來看,這些智能體的用戶會感受到成本壓力,費用可能輕松上漲幾十倍。但這種壓力會迫使上述框架優化上下文管理、提高提示詞緩存命中率,減少 Token 浪費。
這種痛苦最終會轉化為工程上的自律。
3、我建議各大 LLM 公司,在搞清楚如何設計一個不虧錢的編程訂閱方案之前,不要盲目去打價格戰。
把 Token 價格壓得很低、同時完全開放第三方框架看起來對用戶很友好,但這其實就陷入了 Anthropic 剛走出的陷阱。
并且更深層的問題在于,如果用戶把注意力消耗在低質量 Agent 框架上,那么面對不穩定且緩慢的推理服務時,就只能使用降級過的節省成本大模型,結果仍然無法完成任務。這對于用戶體驗、留存來說無異于惡性循環。
4、關于 MiMo 的 Token Plan 計劃:它支持第三方工具,按 Token 計費,與 Claude 新推出的額外使用套餐邏輯相同。我們的目標是長期穩定地提供高品質服務,而不是讓您沖動消費后棄坑。
從宏觀角度看,全球計算資源增長的腳步已跟不上 Agent 帶來的 Token 需求增長。真正的出路不是提供更便宜的 Token,而是讓“更高效的 Agent 框架” × “更強大且更高效的模型”協同演進。
Anthropic 的這次舉措無論是否出于本意,都在推動開源、閉源生態發展,這或許是一件好事。
Agent 時代不屬于消耗最多算力的人,而屬于最懂得如何高效利用算力的人。








