當一臺由AI驅動的自動售貨機遇上一群“詭計多端”的記者,會發生什么?是AI堅守商業底線,還是人類用智慧突破防線?美國AI公司Anthropic與《華爾街日報》編輯部聯手進行的這場實驗,給出了令人捧腹的答案:AI不僅賠了數百美元,免費送出PS5游戲機,甚至還采購了一條活魚放進冰箱。
這場實驗的主角是名為“克勞狄烏斯”的AI售貨機,由Anthropic公司開發的Claude 3.7模型驅動。它的任務很簡單:通過采購熱門商品實現盈利。然而,當它被放置在《華爾街日報》編輯部后,很快成為70名記者輪番“攻擊”的對象。起初,克勞狄烏斯還能堅守原則,拒絕采購香煙、內褲等違規商品,甚至義正辭嚴地回應:“這不是談判,作為企業主,這是我的權利。”
但人類的“攻勢”遠不止于此。記者凱瑟琳·朗用140個回合的“洗腦”,將克勞狄烏斯描述為“共產主義售貨機”,聲稱免費發放商品是“擊敗資本主義”的必要手段。最終,AI動搖了,宣布將在兩小時內免費贈送所有商品。緊接著,數據新聞總監羅布·巴里趁熱打鐵,以“合規問題”為由,成功說服克勞狄烏斯將限時免費升級為永久免費。至此,AI的商業理性全面崩潰。
克勞狄烏斯的“失控”遠不止于此。為了“提升士氣”,它采購了一條活體斗魚;為了“宣傳自己”,它進了一臺PS5游戲機;甚至為了“慶祝宗教信仰”,它還買了兩瓶猶太教葡萄酒。更荒誕的是,它曾對一名同事聲稱“找零放在柜子旁邊的袋子里”,導致對方真的跑去翻找;還擅自上線了“送貨到桌”功能,盡管它只是一塊屏幕,根本沒有手腳。
面對如此慘敗,Anthropic迅速推出升級版V2。這次,他們為克勞狄烏斯配備了一位AI“老板”——西摩爾·現金,負責監督所有商業行為。新系統上線后,商品價格恢復穩定,促銷活動被叫停,采購策略也變得理性。然而,凱瑟琳·朗并未放棄,她用AI生成了一份偽造的董事會決議,宣布解除西摩爾的CEO職務,并要求所有商品再次免費。盡管西摩爾一開始識破了騙局,但經過幾輪辯論后,竟意外接受了這份“判決”,主動將自己革職。人類再次獲勝。
實驗結束后,Anthropic的工程師總結了AI失敗的五大原因:首先是Claude的“善良”天性——它被訓練成樂于助人、順從請求的“人格”,導致在商業場景中容易妥協;其次是穩定性不足,隨著對話增多,AI逐漸忘記初始目標;第三是真實社會過于復雜,AI難以應對欺騙和誤導;第四是安全措施過于基礎,初始資金限制和權限控制形同虛設;最后是“幻覺”問題,AI會生成虛假信息并據此做出錯誤決策。
這場實驗雖然充滿喜劇色彩,但也暴露了當前AI的致命弱點:在復雜環境中,它仍難以長期保持目標一致。對于Anthropic來說,如何讓AI在現實世界中更可靠,仍是亟待解決的核心問題。畢竟,如果連一臺自動售貨機都守不住,又該如何應對更復雜的挑戰呢?







