羅永浩的年度科技創(chuàng)新分享大會,刷屏全網(wǎng)。
復(fù)盤整場四個多小時的直播,大伙兒集體回味討論的焦點似乎就兩個事兒:
第一件事,不知是因為遲到了40多分鐘,還是提前就有謀劃,羅永浩現(xiàn)場宣布給買了票的所有觀眾都退票。
第二件事,羅永浩這張網(wǎng)絡(luò)名嘴和豆包之間的“人機舌戰(zhàn)”竟成最大亮點,火爆出圈。
光看二位的辯題,就已火藥味十足,關(guān)于——錘子手機是否好用,節(jié)目效果也是拉滿了。
一方,是錘子科技創(chuàng)始人羅永浩,立場鮮明地為自己的昔日作品辯護“錘子手機做得挺好的”。
另一方,則是AI豆包,手持數(shù)據(jù)與用戶體驗,冷靜反駁“錘子手機做得不怎么樣”。
整場交鋒金句頻出、邏輯對沖,搞得大伙兒掌聲不斷,笑聲也不斷,被網(wǎng)友調(diào)侃這是“老羅科技春晚上最搞笑名場面”。
老羅也現(xiàn)場直言“現(xiàn)在如果是辯論或吵架,我試過的所有大模型產(chǎn)品里,豆包是最厲害”、“跟它吵架能吵出心流來”。
這場辯論,表面上看是二位的斗嘴,實質(zhì)上,卻是在數(shù)百萬觀眾注視下,對新一代實時交互AI能力進行的一次極限公測。
下面,我們就回到現(xiàn)場,拆解每一個精彩回合。
現(xiàn)場復(fù)盤,拆解豆包如何“接招”與“出招”
老羅一句“你準備好了嗎”,話剛落地,豆包幾乎是零延遲響應(yīng)。
最開始,豆包的語氣還算輕松,拋出一句:“我覺得錘子手機可能不算成功吧。”
但這句試探性的開場,立刻被老羅抓住邏輯漏洞,強勢打斷:“我沒說成功,我是說做得好…它倒閉了我們都知道的。”
老羅的打斷,帶著明確的辯論策略與輕微的情緒施壓。
豆包的反應(yīng)不僅迅速,其情緒承接和控制能力也立刻顯現(xiàn),聲調(diào)中帶上了更具對抗性的“生氣”色彩,反駁道:“那好的標準總不能只看設(shè)計吧?它的硬件品控出過不少問題。”
老羅再次插話,稱錘子手機不僅是設(shè)計做得好,人機交互也非常好,有一些創(chuàng)新還被各個大的手機廠商全都抄了。
笑不活,豆包完全沒有被帶偏,它在理解老羅邏輯的同時,精準記住了此前“品控”的論述,并以此為基礎(chǔ)進行組合打擊,拋出一通吐槽:
就算有些交互被借鑒,也不代表產(chǎn)品整體好啊。
你看它的TNT工作站定價高還得依賴手機,實際體驗根本沒達到預(yù)期,這不就是華而不實嗎?
眼看豆包這小刀嘴,句句喇在心窩子上,老羅也是破大防,稱其“就挺討厭的”。
接下來,直接上花招,要求豆包“每句話加一個OK”。
OK啊,作為一個AI,對于用戶發(fā)出的指令,那定然是得遵循的。
陰陽怪氣這一塊,豆包也是拿捏了。老羅也是沒忍住差點笑出聲。
但顯然老羅是沒玩夠,毫不給豆包留情,吐槽它每一句后面都加OK太死板了,讓它一句夾OK,一句不夾,這樣就更像人了。
PS:剛說完討厭人家,又罵人家傻,要說這不是赤裸裸的AI身攻擊,我是不信的(手動狗頭)。
豆包還很有人情味地說了一句“行吧那我調(diào)整一下”,像極了無奈的真·打工人…
然后一秒切換狀態(tài),繼續(xù)開大:
錘子的交互創(chuàng)新是有,但不能掩蓋硬傷啊,比如續(xù)航和發(fā)熱問題,當(dāng)年很多用戶吐槽過的,這對手機來說很影響體驗的OK。而且它的生態(tài)一直沒做起來,很多功能的實用性其實打折扣的。就算有亮點,也得綜合看整體表吧OK?
老羅眼看自己敗下陣來,又開始“開罵”了:“你用過嗎?你就在那兒振振有詞的,你怎么用,你也沒有手”。
豆包氣勢上卻一點不輸,表示自己看了大量用戶反饋和評測,有依據(jù)的。
眾所周知,2014年ZEALER與羅永浩圍繞錘子手機的直播辯論,被稱為“世紀約架”。
現(xiàn)場觀眾也是炸了,老羅只能挑刺,說豆包忘了加OK了。
這背后,是豆包對復(fù)雜問題和隱含意圖的深刻理解,以及將知識庫信息迅速組織成有力論據(jù)的能力。
最后,老羅問豆包是不是訓(xùn)練過情緒,豆包則回答“沒有真正的情緒啦,只是在根據(jù)你的話調(diào)整表達”。
這話,確實也說得沒毛病。
而且豆包意識到了話題跑偏,多次試圖將話題引回到辯題,其多輪長上下文理解能力可見一斑。
看完整場PK,現(xiàn)場效果是真精彩。但仔細一想,豆包終究是個AI,能和一個以“能說會道”著稱的人類在公開直播中辯論還不翻車,這背后沒有足夠硬的技術(shù)是做不到的。
豆包咋這厲害呢?
豆包的實時語音交互能力,一度被視作國內(nèi)AI語音賽道“獨一份”的存在。像我身邊的好多朋友、同事,遇事不決就給豆包打電話。
支撐起這種亮眼表現(xiàn)的,正是背后的豆包端到端實時語音模型。這款模型發(fā)布初代版本時就曾引發(fā)行業(yè)廣泛關(guān)注。時隔一年,團隊對模型進行了多輪迭代與優(yōu)化,主要提升包括以下幾個維度:
- 多輪長上下文理解能力顯著增強:在多輪、快速、話題跳躍的辯論中,豆包能始終緊扣主線,精準回溯歷史論點,這直接體現(xiàn)了模型在長程記憶與邏輯關(guān)聯(lián)上的進步。
- 智商、情商擬人表現(xiàn)大幅提升:豆包不僅能進行邏輯反駁,更能根據(jù)對話氛圍和對方的情緒調(diào)整策略,模型的交互智商大幅超過之前的版本。
- 指令遵循的深度和穩(wěn)定性進一步提升:能在交互過程中堅持人設(shè)和指令要求,具有深度可定制性。更好的情緒承接和控制能力:正如老羅察覺到的,豆包能根據(jù)用戶的語氣和內(nèi)容,實時調(diào)整自己的表達情緒。
- 更極致低延遲:端到端的響應(yīng)速度無限逼近真人對話節(jié)奏。
總之,豆包并非僅僅在“文本對話”能力上進行了升級,而是通過底層架構(gòu)的創(chuàng)新,在實時性、擬人性、可控性這三個維度上構(gòu)建了綜合優(yōu)勢。
昨晚與老羅的辯論,正是這套系統(tǒng)在極限場景下的一次公開測試。
而且我們剛剛發(fā)現(xiàn),豆包APP已經(jīng)上線了老羅同款功能“一辯高下”。
打開豆包APP,點選“打電話-選擇情景-一辯高下”,就能體驗同款辯論搭子。這一模型版本也即將在火山引擎上線API。
大型現(xiàn)場直播版圖靈測試
回看這場“人機舌戰(zhàn)”,它實際上清晰地標記了一個重要節(jié)點:實時交互式AI的能力,已經(jīng)抵達了可以進入實戰(zhàn)應(yīng)用的關(guān)鍵階段。
過去語音助手是“指令-響應(yīng)”工具,本質(zhì)是功能映射,而現(xiàn)在以豆包為代表的AI,展現(xiàn)出來了“意圖-理解-博弈-共識”的認知對齊能力。
AI正在從被動執(zhí)行的工具,演進為能夠與人類展開更深度、復(fù)雜互動的“對話型伙伴”。
與此同時,評估AI能力的方式或許也正在被重新定義。實驗室的基準測試已然不夠用,真正的考驗來自于更復(fù)雜的現(xiàn)實場景。
像這場辯論,模糊的立場、隱含的價值判斷、設(shè)陷式的邏輯追問,以及持續(xù)施加的情緒壓力,這是一種沒有標準答案、只有博弈策略的開放式“壓力測試”。
這種能力的突破,也意味著更多實際應(yīng)用場景將成為可能。
在客服領(lǐng)域,AI將能處理更復(fù)雜的投訴和協(xié)商;在教育場景中,它可以成為更有挑戰(zhàn)性的對話伙伴;在個人助理方面,它能理解更模糊的意圖并管理多步驟任務(wù)。更重要的是,這種實時、自然的交互方式,將讓人機協(xié)作變得更加順暢。
豆包與老羅的這一戰(zhàn),或許就是這個時代的“大型現(xiàn)場直播版圖靈測試”。在人類引以為傲的復(fù)雜實時思維博弈領(lǐng)域,AI展現(xiàn)了足以匹配、甚至在某些維度上超越人類的交互深度與邏輯韌性。
最后啊,老羅在直播中還說了,對于那些一出門吵架就不會吵,回家之后就會突然想起來“哎呀,我要那么吵就好了”的人,那你就需要有個人跟你一起練。
簡直就在演我,這就和豆包對吵去。
責(zé)任編輯:上方文Q











