近日,關(guān)于“Anthropic封禁OpenClaw”的討論引發(fā)廣泛關(guān)注,但實(shí)際情況是,Anthropic并未完全禁止第三方產(chǎn)品調(diào)用其能力,而是停止了通過Claude Pro等固定付費(fèi)訂閱模式直接調(diào)用的路徑。用戶若想使用Anthropic的模型和產(chǎn)品,仍可通過官方訂閱模式或按量充費(fèi)的API額度進(jìn)行操作。這一調(diào)整被部分人誤解為“封禁”,甚至引發(fā)“過河拆橋”的爭(zhēng)議,但小米MiMo大模型負(fù)責(zé)人羅福莉從行業(yè)角度進(jìn)行了深入分析,認(rèn)為這一舉措是必要的糾偏。
羅福莉指出,Anthropic此前推出的Claude Code訂閱設(shè)計(jì)在算力分配問題上具有創(chuàng)新性,其邏輯是通過補(bǔ)貼重度用戶來平衡輕度用戶的低頻使用,從而實(shí)現(xiàn)整體均衡。然而,這一模式的前提是用戶必須使用Anthropic自身的框架。一旦脫離原生框架,第三方工具如OpenClaw的接入會(huì)打破這種平衡。她以O(shè)penClaw為例,說明其在單次用戶查詢中會(huì)觸發(fā)多輪低價(jià)值工具調(diào)用,每輪請(qǐng)求攜帶的上下文窗口往往超過100K tokens,導(dǎo)致實(shí)際請(qǐng)求次數(shù)是原生框架的數(shù)倍。按API定價(jià)計(jì)算,真實(shí)成本可能是訂閱價(jià)格的數(shù)十倍。
除了請(qǐng)求次數(shù)的問題,第三方工具的緩存效率也令人擔(dān)憂。羅福莉提到,許多第三方工具在接近上下文長度限制時(shí),會(huì)頻繁壓縮工具返回結(jié)果,導(dǎo)致緩存命中率極低。Claude的緩存機(jī)制依賴上下文前綴的一致性,而壓縮操作會(huì)改寫上下文內(nèi)容,使前綴失配,緩存失效,模型被迫重新全量讀入。這種雙重問題將每次查詢的實(shí)際token消耗推向極值,使得訂閱制賴以成立的分布假設(shè)徹底崩塌,Anthropic不得不獨(dú)自承擔(dān)成本缺口。
她用健身房辦卡的例子形象地解釋了這一現(xiàn)象:健身房的盈利模式依賴于部分用戶辦卡后不常使用,從而補(bǔ)貼高頻用戶的成本。但如果所有用戶都像OpenClaw的用戶一樣,7x24小時(shí)高強(qiáng)度使用,健身房的成本將無法控制。同樣,Anthropic的訂閱制在第三方工具的濫用下,成本結(jié)構(gòu)徹底失衡。
對(duì)于用戶的憤怒,羅福莉認(rèn)為這是短期陣痛,但長期來看有助于改善工程紀(jì)律。她指出,第三方工具仍可調(diào)用Claude,只是不能再依賴訂閱制的“便宜”。短期內(nèi),用戶會(huì)感受到成本激增,但這種壓力將推動(dòng)工具開發(fā)者優(yōu)化上下文管理、提高緩存命中率、減少無效token消耗。她強(qiáng)調(diào),訂閱制的問題在于,它讓開發(fā)者無需為單次請(qǐng)求的token消耗負(fù)責(zé),導(dǎo)致上下文管理粗糙、緩存命中率低等問題被忽視。而一旦回到API計(jì)費(fèi)模式,token浪費(fèi)將直接體現(xiàn)在賬單上,優(yōu)化效率將成為商業(yè)驅(qū)動(dòng)的工程需求。
羅福莉還批評(píng)了當(dāng)前大模型行業(yè)的“token價(jià)格戰(zhàn)”。她認(rèn)為,單純?yōu)榱藅oken消耗而狂歡,以及模型廠商為爭(zhēng)奪用戶而打的價(jià)格戰(zhàn),是不可持續(xù)的。她警告說,低價(jià)賣token的同時(shí)向第三方全面開放,看似對(duì)用戶友好,實(shí)則是一個(gè)陷阱。Anthropic剛剛從這一陷阱中走出來,其他廠商若盲目跟進(jìn),可能導(dǎo)致用戶在劣質(zhì)工具、不穩(wěn)定推理服務(wù)或降配模型上反復(fù)碰壁,最終影響用戶體驗(yàn)和留存。
她進(jìn)一步解釋了這一陷阱的機(jī)制:大模型公司推出coding plan向第三方工具開放,會(huì)因上下文管理粗放、冗余請(qǐng)求和低緩存命中率而導(dǎo)致算力浪費(fèi),成本完全由平臺(tái)承擔(dān)。為了控制成本,平臺(tái)只能降低算力或換用更便宜的低智模型,用戶表面上有充足的額度,但實(shí)際效果不佳,留存率自然下降。問題的根源在于計(jì)費(fèi)結(jié)構(gòu),訂閱制切斷了用量與成本之間的信號(hào)傳導(dǎo),迫使平臺(tái)最終選擇封禁第三方或降速、限流、降配模型。
羅福莉還介紹了小米MiMo的Token Plan,認(rèn)為其走了一條不同的路。MiMo沒有封掉第三方入口,而是改變了計(jì)費(fèi)結(jié)構(gòu):按實(shí)際token消耗量配額,開發(fā)者購買以Credit為單位的token額度。無論使用原生框架還是第三方工具,每一個(gè)浪費(fèi)的token都直接從用戶的額度包里扣除。平臺(tái)不再為低效工具買單,用得多付得多,用得糙成本高,“用量-成本”的關(guān)系重新透明起來。她將這套邏輯定位為:不是不讓用,而是讓計(jì)費(fèi)結(jié)構(gòu)本身成為約束機(jī)制,推動(dòng)生態(tài)向高效率方向演化。
最后,羅福莉?qū)⒁曇袄搅烁蟮目蚣苌稀K赋觯蛩懔Φ墓┙o速度已經(jīng)追不上Agent場(chǎng)景下token消耗的增速,真正的出路不是更便宜的token,而是協(xié)同進(jìn)化:更高token效率的Agent工具,乘以更強(qiáng)大、更高效的模型。她認(rèn)為,Anthropic的調(diào)整,無論出于什么動(dòng)機(jī),都在客觀上把整個(gè)生態(tài)推向了這個(gè)方向。對(duì)于各類工具產(chǎn)品以及模型廠商來說,這一舉措的信號(hào)意義很強(qiáng),若仍想著靠免費(fèi)量大管飽去接住一波流量用戶,就太不合時(shí)宜了。一個(gè)階段性的狂歡是時(shí)候讓位于在工程和基礎(chǔ)設(shè)施設(shè)計(jì)上的真正重要的工作了。





