近期,曾被開發(fā)者視為“最強AI編程助手”的Anthropic旗下Claude系列模型陷入爭議。盡管該公司憑借該系列產(chǎn)品實現(xiàn)年化收入突破300億美元,超越競爭對手OpenAI,但近期模型升級后出現(xiàn)的性能下滑問題,正引發(fā)行業(yè)廣泛關(guān)注。
AMD人工智能業(yè)務(wù)主管斯特拉·勞倫佐公開批評稱,自2月模型更新后,Claude Code在處理復(fù)雜工程代碼時表現(xiàn)顯著退化。她帶領(lǐng)的團(tuán)隊通過分析6852次對話記錄發(fā)現(xiàn),工具調(diào)用次數(shù)達(dá)234760次,但思維鏈中斷、尋求確認(rèn)等異常行為從零激增至每日平均10次。更嚴(yán)重的是,模型閱讀代碼的次數(shù)從6.6次驟降至2次,卻頻繁發(fā)起全文件重寫操作,導(dǎo)致編輯頻率異常升高。
GitHub開發(fā)者社區(qū)的反饋與專業(yè)團(tuán)隊觀察高度吻合。多名程序員指出,當(dāng)思維鏈深度不足時,模型會采取“最低成本策略”:跳過代碼閱讀直接修改,遇到困難立即終止任務(wù)。這種逃避責(zé)任的行為模式,使得復(fù)雜問題的修復(fù)方案往往流于表面而非根本解決。有開發(fā)者形象描述:“現(xiàn)在的Claude就像考試時只寫公式不計算的學(xué)生,表面功夫做足卻交不出正確答案。”
勞倫佐在技術(shù)博客中直指問題核心,懷疑Anthropic通過限制思維鏈的Token數(shù)量來控制成本,這種“節(jié)流”措施直接導(dǎo)致輸出質(zhì)量斷崖式下跌。她要求公司公開模型優(yōu)化細(xì)節(jié),并增設(shè)專門處理復(fù)雜工程的高階思維鏈層級。這位技術(shù)主管透露,AMD已臨時更換服務(wù)供應(yīng)商,但拒絕透露新合作方名稱,僅暗示“現(xiàn)有市場中能與Claude抗衡的選項極為有限”。
這場風(fēng)波暴露出AI編程工具的深層矛盾:模型規(guī)模擴(kuò)張與質(zhì)量控制的平衡難題。盡管Anthropic尚未正式回應(yīng)質(zhì)疑,但開發(fā)者社區(qū)已自發(fā)建立代碼質(zhì)量監(jiān)測機(jī)制,通過對比不同版本的輸出結(jié)果,持續(xù)追蹤模型性能變化。這場由行業(yè)頭部企業(yè)引發(fā)的爭議,或?qū)⑼苿诱麄€領(lǐng)域重新審視AI輔助編程的技術(shù)路線。











