Z Highlights
目前已經(jīng)出現(xiàn)了一些早期跡象,通用LLM助手領域的市場格局,正朝著“贏家通吃”,至少是“贏家通吃大部分市場”的趨勢發(fā)展。在ChatGPT、Gemini、Claude 3和Cursor這幾款產(chǎn)品中,僅有9%的用戶會為一款以上的產(chǎn)品付費。
不過,今年的一大突破在于,圖像和視頻生成模型在真實感和推理能力這兩個維度都取得了長足的進步。這里所說的真實感,指的是那些能讓圖像或視頻看起來栩栩如生的細節(jié)。
驅動社交應用發(fā)展的動力源于用戶的兩種心理:一種是積極的自我表達欲,另一種是消極的焦慮感。說到底,這就是一場 “地位博弈”。
一款真正成功的社交產(chǎn)品,必須同時兼顧內容消費和內容創(chuàng)作兩大功能,而且它所產(chǎn)出的內容,應該是其他平臺無法替代的,就像TikTok的短視頻和YouTube的短視頻那樣,具有獨特的平臺屬性。
如今,大模型的性能已經(jīng)達到了足以支撐開發(fā)者搭建真正可規(guī)模化應用的水平。因此,我們有理由期待,2026年將會成為消費級AI應用開發(fā)者大放異彩的一年。
2025年末,消費級AI已邁入全新發(fā)展階段,市場格局漸顯且多模態(tài)技術重塑創(chuàng)意工作流,行業(yè)變革與機遇并存。2025年12月29日,全球頂尖風投機構a16z消費領域合伙人Olivia Moore、Anish Acharya、Justine Moore和Bryan Kim受邀參與節(jié)目,一同回顧2025年AI領域在產(chǎn)品與模型層面的重大變革,展望2026年發(fā)展趨勢,深入探討消費級AI “贏家通吃” 格局成因、產(chǎn)品設計核心價值等關鍵議題。
2025消費級AI市場格局:頭部領跑與競爭態(tài)勢
Olivia Moore:今天,我們要探討的話題是“誰是2025年消費級AI賽道的贏家”。可以說,在這一年里,兩大模型巨頭——OpenAI和Google,比其他任何企業(yè)都更積極地向消費級市場發(fā)力。無論是推出新模型,還是發(fā)布面向主流用戶的新產(chǎn)品、新功能與新交互界面,兩家公司都動作頻頻。
或許有人會疑惑,究竟誰在這場競爭中處于領先地位,這件事真的重要嗎?目前已經(jīng)出現(xiàn)了一些早期跡象,表明通用LLM助手領域的市場格局,正朝著“贏家通吃”,至少是“贏家通吃大部分市場”的趨勢發(fā)展。數(shù)據(jù)顯示,在ChatGPT、Gemini、Claude 3和Cursor這幾款產(chǎn)品中,僅有9%的用戶會為一款以上的產(chǎn)品付費。而在今年的大部分時間里,使用ChatGPT的用戶中,不足10%的人會去體驗Gemini這類其他頭部LLM服務商的產(chǎn)品。
如果現(xiàn)在就下定論的話,ChatGPT無疑是當前的絕對領跑者,其周活躍用戶數(shù)量達到了8億至9億。據(jù)估算,Gemini在網(wǎng)頁端的用戶規(guī)模約為ChatGPT的35%,在移動端則達到了40%左右,其他所有產(chǎn)品都遠遠落后于這兩者。例如,Claude 3、Grok和Perplexity的使用率僅在8%至10%之間。
不過,尤其是在過去的3至6個月里,隨著Nano Banana這類迅速走紅的新模型問世,市場格局正發(fā)生著迅猛的變化。Gemini的桌面端用戶數(shù)量同比增長了155%,而且即便用戶規(guī)模已經(jīng)相當可觀,其增長速度仍在加快,這一表現(xiàn)著實令人驚嘆。相比之下,ChatGPT的同比增長率僅為23%。與此同時,我們也注意到,像Anthropic這樣的玩家,開始在消費級市場深耕特定細分領域,例如主攻技術需求極高的用戶群體。
因此,今天我們邀請到了a16z的消費級投資團隊,一同回顧今年頭部模型公司在消費級市場的表現(xiàn),并預測2026年該領域的發(fā)展趨勢。
核心模型與產(chǎn)品創(chuàng)新:多模態(tài)突破與技術演進
Anish Acharya:謝謝Olivia。這一年確實精彩紛呈。如果我們把時間拉回到去年一月,或許可以先從這一年里的產(chǎn)品發(fā)布、市場反響、成功經(jīng)驗與失敗教訓談起。Justine,來和我們分享一下你今年的觀察吧。對于OpenAI和Google這兩家公司,你重點關注了哪些方面?又有哪些觀點發(fā)生了轉變?
Justine Moore:好的。正如Olivia所說,這兩家公司今年在消費級市場的產(chǎn)品發(fā)布尤為密集。
從模型層面來看,它們今年推出的最受消費者追捧的模型,當屬圖像與視頻生成類模型。以OpenAI為例,今年推出的ChatGPT-4o圖像功能曾引發(fā)了“Giblly時刻”那樣的熱潮——說起來有點不可思議,這一現(xiàn)象竟然就發(fā)生在今年,感覺卻像過去了好幾年。當然,還有Sora 2這款視頻生成模型。
再看Google,其推出的VO系列模型,包括VO3和VO3.1,以及圖像生成模型Nano Banana和Nano Banana Pro,都迅速走紅,其熱度即便沒有超過,也足以與OpenAI的“Giblly時刻”相媲美。
在產(chǎn)品層面,我們能看到兩家公司截然不同的策略:OpenAI傾向于將更多功能整合到ChatGPT的主界面中。例如,Pulse群聊、購物、研究任務等功能,都是以ChatGPT為核心平臺推出的。唯一的例外是Sora,它作為一款獨立的視頻應用存在。
而Google則更傾向于推出獨立產(chǎn)品。雖然他們也通過Google AI Studio、Google Labs、Gemini等眾多自有平臺發(fā)布了不少產(chǎn)品,但同時也推出了許多可直接訪問的獨立網(wǎng)站。這種模式能夠為不同類型的產(chǎn)品打造更具針對性的定制化界面,而不僅僅局限于“輸入文本—輸出文本”或“輸入指令—生成圖像/視頻”這樣單一的交互形式。
Anish Acharya:Justine,關于這一點我有個問題想請教你。記得18個月前,我們還在熱議Midjourney,當時大多數(shù)多模態(tài)模型的核心競爭力都體現(xiàn)在美學風格和真實感上。如今這種情況是否依然如此?今年該領域又發(fā)生了哪些變化?
Justine Moore:各類模型在風格上的差異依然存在。而且我發(fā)現(xiàn),在深耕圖像和視頻生成領域的人群中,Midjourney的地位依舊無可替代——它具備一種獨特的美學表現(xiàn)力,而這種能力,其他很多模型如果不借助精準的Prompt,是很難實現(xiàn)的。
不過,今年的一大突破在于,圖像和視頻生成模型在真實感和推理能力這兩個維度都取得了長足的進步。這里所說的真實感,指的是那些能讓圖像或視頻看起來栩栩如生的細節(jié)。比如,當畫面中有人在行走交談時,背景街道上行駛的車輛,其行駛方向必須符合常理,不能出現(xiàn)變形或違和的情況。
而在推理能力方面,現(xiàn)在的模型已經(jīng)能夠接收多張輸入圖像和文本指令,并綜合分析這些輸入信息,生成出具有連貫性的設計方案之類的內容。這種能力,在去年是絕對無法想象的。
Bryan Kim:沒錯。我還記得,以前我們還會為模型能在圖像中準確生成文字而興奮不已,而現(xiàn)在,模型已經(jīng)可以輕松生成精美的信息圖表了。更令人驚嘆的是,我們只需上傳一段優(yōu)質的YouTube視頻,然后指令模型“生成一張能解釋這段視頻內容的圖片”,它就能完美完成任務。這種進步真的是天壤之別。
Olivia Moore:Nano Banana Pro甚至可以生成市場格局圖,我就親自試過一次,效果非常驚艷。而且這款模型已經(jīng)具備,或者即將具備在圖像生成過程中整合網(wǎng)絡搜索的能力——它能通過搜索獲取準確的企業(yè)名單,還能自動抓取這些企業(yè)的相關圖片并融入生成的圖像中,這種功能簡直太強大了。
Justine Moore:不過圖像生成模型的推理能力目前還存在一個尚未攻克的難題。就在昨天,我測試了ChatGPT image 1.5,發(fā)現(xiàn)它在處理需要多步驟推理的任務時,依然存在困難。
我設計的測試任務是這樣的:上傳一張大富翁游戲棋盤的圖片,然后指令模型“移除棋盤上所有地產(chǎn)的名稱,將其替換為AI實驗室和初創(chuàng)企業(yè)的名稱”。測試結果顯示,ChatGPT image 1.5的表現(xiàn)已經(jīng)是最接近目標的,但它仍然很難完成整個任務流程——既要刪除原有名稱,又要構思新的名稱,還要將新名稱準確放置在對應的位置上,同時還要確保沒有重復命名,也不會遺漏任何重要的企業(yè)。由此可見,圖像生成模型的發(fā)展依然有很長的路要走。
Bryan Kim:有意思的是,我發(fā)現(xiàn)ChatGPT的圖像生成模型有一個很突出的優(yōu)勢,就是它能在多次生成圖像的過程中,保持角色形象和藝術風格的一致性。這一點讓非常驚艷,尤其在故事板創(chuàng)作這類場景中,這種能力會激發(fā)用戶持續(xù)生成更多相關內容的欲望。
Anish Acharya:在我看來,Nano Banana這款模型最被低估的一點,在于它與搜索功能的整合。我們之前談到,模型的真實感關乎物理規(guī)律等底層邏輯,推理能力則關乎能否精準執(zhí)行用戶的修改指令,而除此之外,還有一個關鍵維度就是準確性。
產(chǎn)品攝影就是一個很好的例子。如果你讓模型“生成這張專輯封面的圖片”,或者“生成一張能還原某個歷史瞬間的真實照片”,那么模型就必須借助搜索功能獲取準確信息,才能完成任務。這種將圖像生成與搜索整合的思路,雖然乍看之下并不直觀,但實際應用價值卻非常高。
Olivia Moore:完全同意你的看法。這讓我想到了VO3模型的走紅——當初,恐怕沒人能預料到,將音頻與視頻融合在同一個模型中,竟然會成為引爆AI視頻生成領域的關鍵突破。自VO3問世以來,我的社交平臺信息流里就充斥著各種超逼真的AI生成視頻,如今Sora或許已經(jīng)成為了該領域的領軍者,但VO3無疑是當之無愧的開拓者。
Bryan Kim:我專門統(tǒng)計過,我社交平臺信息流里的內容,大約有五分之一都是AI生成的。真的太神奇了。
產(chǎn)品設計與用戶體驗:細節(jié)決勝與場景落地
Anish Acharya:聊了這么多今年的產(chǎn)品發(fā)布,其中不少產(chǎn)品,比如VO系列和Nano Banana,都取得了巨大的成功。那在各位看來,今年有哪些被低估的產(chǎn)品,或者哪些產(chǎn)品沒有獲得應有的關注呢?
Bryan Kim:這是個好問題。目前全球市場中,像Pulse這樣的產(chǎn)品可能依然處于被低估的狀態(tài)。我們之前一直在談論OpenAI和Google,在我看來,這兩家公司的產(chǎn)品都屬于生產(chǎn)力工具范疇。如果你現(xiàn)在打開應用商店就會發(fā)現(xiàn),在生產(chǎn)力類應用的排行榜前十中,光是Google的產(chǎn)品就占據(jù)了五個席位,這簡直太驚人了。而ChatGPT則穩(wěn)居榜首。這類生產(chǎn)力工具的核心價值在于幫助用戶更高效地處理各類事務。
我注意到,現(xiàn)在很多開發(fā)者都在從另一個角度進行探索——比如,如何獲取用戶的數(shù)據(jù)、日程安排和電子郵件信息,從而為用戶提供更具針對性的服務,并主動向用戶推送提醒和總結。我知道有很多團隊都在深耕這個方向。
考慮到ChatGPT的用戶使用頻率——我記得大概是每周25次,這個數(shù)據(jù)相當可觀了。基于如此高的用戶活躍度,ChatGPT其實非常適合向用戶推送主動提醒、內容總結等功能,從而全方位地為用戶的生活提供助力。
一直以來,“超級應用”(everything app)的概念在西方市場都像是一個傳說。而OpenAI目前正在朝著這個方向邁進——通過整合足夠多的用戶數(shù)據(jù),再加上極高的用戶活躍度,未來它完全有能力為用戶提供真正實用的主動推送服務。這個領域的發(fā)展?jié)摿ψ屛页錆M期待。
Anish Acharya:那你是ChatGPT的日活躍用戶嗎?
Bryan Kim:其實我不是。
Anish Acharya:那你用過Pulse嗎?
Bryan Kim:也沒有。
Olivia Moore:我倒是試用過一段時間的Pulse,但后來基本就停用了。不過我同意Bryan的觀點,Pulse以及OpenAI今年推出的其他幾款產(chǎn)品,其實都蘊含著全新的技術雛形或理念,它們之所以被低估,很大程度上是因為產(chǎn)品的執(zhí)行層面還有所欠缺。
另一個類似的例子,就是OpenAI推出的“連接器”功能——現(xiàn)在用戶可以通過該功能,將自己的日歷、電子郵件和文檔等數(shù)據(jù)與ChatGPT進行關聯(lián),而且這個功能在云端也能使用。理論上,用戶可以指令ChatGPT“閱讀我過去六個月里的所有備忘錄,并總結出其中最有意思和最乏味的內容”。
這個功能的潛力其實非常令人興奮,但就目前的使用體驗來看,它的可靠性還有待提升。不過我相信,隨著大模型性能的不斷優(yōu)化,如果OpenAI能把這個功能打磨好,那么它完全有機會在專業(yè)級用戶(ZP注:prosumer,指兼具專業(yè)需求和消費屬性的用戶群體)的工作場景中占據(jù)主導地位。
Bryan Kim:專業(yè)級用戶確實是一個絕佳的目標群體。我們雖然偶爾會討論這個群體,但必須意識到,99%的普通用戶并不會像我們這樣,完全依賴日歷來管理生活。不過回到之前提到的ChatGPT用戶使用頻率——每周24次的使用次數(shù),其實已經(jīng)為產(chǎn)品后續(xù)的功能拓展奠定了非常堅實的基礎。
Anish Acharya:沒錯。Olivia,你可是公認的AI產(chǎn)品重度用戶。那目前你還在堅持使用哪些產(chǎn)品?你的核心產(chǎn)品組合都有哪些?
Olivia Moore:這個問題問得好。其實在所有頭部模型公司的產(chǎn)品中,今年最讓我印象深刻、也是我使用頻率最高的一款產(chǎn)品,是Perplexity推出的Comet瀏覽器。需要說明的是,我并沒有把Perplexity當作自己的主力通用LLM助手,相比之下,我使用ChatGPT和Claude 3的頻率要高得多。但Perplexity Comet瀏覽器的表現(xiàn)確實堪稱一流,一方面是因為它內置了Agent模型,另一方面,更重要的是它支持用戶自定義工作流——用戶可以設置在特定時間,或者在訪問特定網(wǎng)頁時,自動重復執(zhí)行某項任務。這款產(chǎn)品的發(fā)展動態(tài)一直讓我非常關注。從數(shù)據(jù)來看,Comet瀏覽器發(fā)布時的流量峰值,以及后續(xù)的用戶留存率,都遠遠超過了ChatGPT自家推出的Atlas瀏覽器。考慮到ChatGPT的渠道分發(fā)能力要比Perplexity強得多,這樣的對比結果確實有些出人意料。Perplexity今年還推出了一款電子郵件助手,并且收購了幾家在Agent技術領域實力強勁的初創(chuàng)公司。因此,我非常期待他們明年能推出更多面向專業(yè)級用戶的專屬交互界面,這會是他們未來值得深耕的一個絕佳方向。
細分賽道博弈:社交嘗試、挑戰(zhàn)者突圍與生態(tài)競爭
Anish Acharya:Perplexity這家初創(chuàng)企業(yè),給人的感覺是它的野心格局極為宏大,完全可以與那些頭部AI實驗室以及大型科技公司相媲美。單看他們今年推出的產(chǎn)品數(shù)量,就足以令人嘆服。Justine,我還有個問題想請教你——Gemini憑借其一系列圖像和視頻生成模型,如今確實風頭正勁。你認為它有機會超越ChatGPT嗎?這類模型的市場需求,真的有那么旺盛嗎?
Justine Moore:答案是肯定的。從我觀察到的情況來看,市場對于頂尖級圖像或視頻生成模型的需求,幾乎是無限的。原因在于,這類模型會吸引形形色色的用戶群體關注和使用。對于專業(yè)用戶而言,比如從事市場營銷、娛樂產(chǎn)業(yè)或故事板創(chuàng)作的人群,他們總是希望使用該領域最前沿的工具。因此,為了使用VO模型,他們完全愿意跳出ChatGPT和Sora的生態(tài),轉向其他平臺。即便是普通消費者,頂尖圖像和視頻生成模型的新功能也常常會催生大量熱門潮流,進而帶動用戶去嘗試那些他們從未接觸過的新產(chǎn)品。比如,用戶可能會專門下載Gemini應用,或是偶然進入Google AI Studio——我知道谷歌原本希望這個平臺更多地面向開發(fā)者,但在過去幾個月里,很多用戶都通過它體驗到了Nano Banana Pro。
Olivia Moore:沒錯。在我看來,Gemini的一大優(yōu)勢在于,它理論上可以充分借助谷歌龐大的渠道分發(fā)優(yōu)勢。數(shù)據(jù)顯示,在安卓系統(tǒng)中,Gemini的移動端用戶規(guī)模已經(jīng)達到了ChatGPT的50%左右,而在蘋果iOS系統(tǒng)中,這一比例僅為17%。由此可見,安卓端的策略顯然是奏效的。谷歌最近還在Chrome瀏覽器中推出了小型Gemini小組件,以此鼓勵用戶使用;同時,他們也在將Gemini整合到Google Docs、Gmail等其他應用中。但問題在于,大多數(shù)普通人目前仍然只使用一款AI產(chǎn)品,而ChatGPT就像是AI領域的“舒潔紙巾”(Kleenex)——這個品牌已經(jīng)完全成了同類產(chǎn)品的代名詞。正是基于這一點,Gemini要實現(xiàn)超越,仍然需要跨越一個巨大的障礙。不過,如果他們能繼續(xù)保持當前的勢頭,持續(xù)推出那些極具話題性的消費級創(chuàng)意工具和模型,那么明年確實有可能實現(xiàn)趕超。
Bryan Kim:我也一直在思考這個問題。Gemini的特點很有意思——它看似無處不在,但在某種程度上又仿佛“無處可尋”。從實際使用情況來看,用戶想到AI工具時,還是會第一時間聯(lián)想到ChatGPT這個代名詞。不過,產(chǎn)品設計理念的差異也同樣值得關注。今天早上,我同時打開了兩個窗口:一個是OpenAI的圖像生成模型,另一個是谷歌Gemini的圖像功能。打開Gemini后,屏幕上一片空白,彈出的窗口寫著“我們推出了Nano Banana,你是否要體驗一番?”,旁邊還有一個需要手動輸入指令的小輸入框。說實話,我當時完全不知道該輸入什么。
而反觀ChatGPT,它的界面設計極具TikTok風格,會直接展示當下的熱門生成主題,比如“手繪風格”等,用戶只需點擊選擇,再上傳一張參考圖片,就能生成驚艷的作品。生成完成后,系統(tǒng)還會進一步推薦:“你是否想要生成節(jié)日賀卡?”“是否需要生成其他類型的內容?”等。正是這些產(chǎn)品細節(jié)上的巧妙設計,才能真正推動用戶邁出嘗試的第一步;而當用戶體驗到生成內容的角色一致性后,他們自然會愿意繼續(xù)使用下去。所以,這一點很有意思——OpenAI和ChatGPT團隊已經(jīng)證明,他們具備更深厚的產(chǎn)品設計洞察力。
不過,我想到一個有趣的點,可能說出來不太妥當。我曾在Snap公司工作過,大家應該都知道,在meta和Snap的競爭史上,Evans Spiegel曾擔任meta的首席產(chǎn)品官。這讓我不禁猜想,未來會不會出現(xiàn)這樣一種情況:始終在產(chǎn)品層面不斷創(chuàng)新的ChatGPT團隊,就像當年的Snap;而手握渠道分發(fā)優(yōu)勢的谷歌,則如同當年的meta——谷歌看著ChatGPT的創(chuàng)新,覺得“這個功能不錯”,然后直接將其整合到自己的產(chǎn)品中,繼續(xù)保持領先地位。
Justine Moore:你剛才提到的ChatGPT圖像生成界面,其實是在我們錄制本期訪談的前一天才剛剛上線的。要知道,OpenAI其實多年前就已經(jīng)擁有了圖像生成模型,卻花了這么久的時間,才為圖像生成功能打造出一個相對基礎的獨立界面。我甚至可以說,是那些專注于應用層的公司,比如Creas、Hedraas、Higsfields等,率先普及了這種模板化的設計形式,并且做得更為出色。而這些公司,其實都算是ChatGPT的生態(tài)合作伙伴。
Bryan Kim:所以說,這就像是一條產(chǎn)品創(chuàng)意的供應鏈。完全沒錯,向來如此。
Anish Acharya:好的,我們不妨稍微換個話題。Bryan,你一直對社交領域很有研究,而且長期以來對AI產(chǎn)品的社交功能持關注態(tài)度。我非常好奇你對OpenAI社交功能的看法——畢竟,這類功能的成功不僅需要出色的產(chǎn)品執(zhí)行能力,還離不開合理的網(wǎng)絡設計。當然,Sora在這方面也做了一些嘗試,我們稍后也可以聊聊。另外,ChatGPT還內置了群聊功能。你對這些社交功能的前景,是看好還是看衰?目前的觀點是什么?
Bryan Kim:就目前而言,我是看衰的。原因主要有兩點。我有一個分析產(chǎn)品的方法,我稱之為“深層動機理論”(Inception Theory)——就是通過層層挖掘,找到用戶使用產(chǎn)品的核心訴求,最本質的訴求可能類似于“我希望得到父親的認可”。這種分析方法,對我自己適用,對所有人也同樣適用。
基于這個理論,我分析了ChatGPT這類產(chǎn)品:當你一層層剝開它的核心價值,會發(fā)現(xiàn)它的本質是“幫助我變得更好”——幫我獲取信息、提高效率、提升生產(chǎn)力。而當我們分析meta的Instagram、甚至是TikTok這類社交應用時,會發(fā)現(xiàn)它們試圖滿足的用戶需求主要分為兩個層面:對于TikTok來說,核心需求是“讓我開心”,就像“我需要一個小丑來逗我開心”;而更深層的需求則是“我感到孤獨,我渴望被關注,我想要與他人建立連接”。
在我看來,這兩類產(chǎn)品的發(fā)展方向是截然不同的。OpenAI的產(chǎn)品確實非常出色,堪稱“魔法般的存在”,但它歸根結底屬于“幫助我”的品類,這也是它能在生產(chǎn)力工具領域穩(wěn)居榜首的原因。而現(xiàn)在,OpenAI卻試圖將社交屬性強行植入產(chǎn)品,告訴用戶“大家一起來,更好地建立連接吧”,讓用戶感覺自己“被關注”。以群聊功能為例,我個人其實很喜歡這個功能——用它來規(guī)劃旅行,確實能很好地解決協(xié)作中的痛點。但它的使用場景最終可能僅限于兩到三個人以“尋求幫助”為目的的協(xié)作規(guī)劃。這與“我因為參與了某個社群,而對某個小眾領域有了更深刻的理解”這種社交需求,有著本質的區(qū)別。所以,長期來看,這種品類上的差異,就是OpenAI社交功能難以成功的原因。但這并不意味著,他們不能開發(fā)一款獨立的產(chǎn)品,來專門滿足用戶的社交需求。
Justine Moore:說到社交功能,除了群聊之外,Sora 2是今年所有消費級AI產(chǎn)品中,在社交化方向上的另一大重要嘗試。
Olivia Moore:沒錯,Sora 2的界面設計很像TikTok的信息流,只不過里面的內容全都是AI生成的視頻,而且用戶還可以制作自己朋友的客串特效視頻。
Bryan Kim:這種客串特效的設計,確實是一步妙棋,非常成功。
Justine Moore:不過,從用戶留存數(shù)據(jù)和實際使用情況來看,Sora 2作為創(chuàng)作工具的表現(xiàn)極為亮眼——現(xiàn)在我的社交信息流里,有三分之二以上的內容都是AI生成的,其中超過50%都來自Sora,而在此之前,這些內容大多來自VO和其他一些小眾模型。但遺憾的是,它作為社交應用的內容消費屬性,表現(xiàn)卻不盡如人意。具體來說,只有一小部分創(chuàng)作者在持續(xù)產(chǎn)出大量內容,然后將這些內容發(fā)布到TikTok、Instagram、X、Reddit等平臺,并在這些平臺上迅速走紅;但在Sora應用內部,內容消費、二次創(chuàng)作和評論互動的熱度,都遠不如初期了。
Bryan Kim:其實,我對Sora的定位有一個有趣的看法——它的競爭對手或者說參照物,不應該是TikTok,而應該是CapCut(剪映)。從某種意義上說,它更像是一款創(chuàng)意工具。這個角度很有意思。
Olivia Moore:你這個觀點很有道理,這其實也印證了你之前提到的那個核心論點——驅動社交應用發(fā)展的動力源于用戶的兩種心理:一種是積極的自我表達欲,另一種是消極的焦慮感。說到底,這就是一場 “地位博弈”。比如,用戶會想“我發(fā)布的內容涉及個人隱私,有點敏感”,或者“我希望別人覺得我是這樣的人”,這些心理才是驅動用戶在應用內積極參與互動的核心因素。說到底,這就是一場“地位博弈”。但當內容變成了AI生成的,而且大家都知道這些內容并非用戶真實的自我表達時,這種“地位博弈”的價值就大大降低了。當然,新的“地位博弈”也會隨之產(chǎn)生——比如“誰能寫出更厲害的Prompt”,但這已經(jīng)屬于另一種產(chǎn)品邏輯了。這也是為什么Sora生成的內容能在推特等既有平臺上迅速走紅,卻難以在自身應用內形成社交生態(tài)的原因。
Anish Acharya:不過,我倒是有一個相反的觀點,或者說一個看好Sora 2的理由——它所引發(fā)的“地位博弈”,更多的是圍繞“幽默感”展開的。而幽默感的產(chǎn)生,恰恰是“Prompt撰寫能力”和“文化敏感度”的結合。所以,如果Sora團隊能沿著這個方向持續(xù)迭代,或許能開辟出一個前所未有的全新賽道。
Olivia Moore:話雖如此,但用戶如果可以將生成的視頻導出到其他平臺,那是不是意味著,集成了Sora視頻的TikTok,其實比Sora本身更具吸引力?
Bryan Kim:我們其實已經(jīng)討論過很多次這個問題了——一款真正成功的社交產(chǎn)品,必須同時兼顧內容消費和內容創(chuàng)作兩大功能,而且它所產(chǎn)出的內容,應該是其他平臺無法替代的,就像TikTok的短視頻和YouTube的短視頻那樣,具有獨特的平臺屬性。
Anish Acharya:那么,大家對那些挑戰(zhàn)者品牌有什么看法?我們之前一直在討論頭部企業(yè),其實說起來很有意思,meta在這個語境下,也算是一個挑戰(zhàn)者,但更典型的挑戰(zhàn)者品牌,應該是Claude、Perplexity和Grok。Olivia,你怎么看?
Olivia Moore:我非常喜歡Claude,平時經(jīng)常使用它。對我來說,Claude在很大程度上已經(jīng)取代了ChatGPT,成為我日常使用的主力通用LLM。Claude的一個有趣之處在于,它是一個“有主見”的模型。我之所以青睞它,還因為我愿意花時間去搭建基于它的AI工作流。我注意到,Claude今年推出了很多強大的功能,比如artifacts和skills——用戶通過這些功能,基本上可以設置任務或工作流,并讓其自動運行。不過,它之所以尚未普及到大眾市場,主要原因在于,這些功能的設計初衷更多地面向技術用戶或工程師群體。盡管Anthropic團隊已經(jīng)盡力讓skills功能的創(chuàng)建過程變得簡單,但對于普通消費者來說,操作門檻依然很高。
再舉個例子,Anthropic其實是頭部企業(yè)中最早推出文件創(chuàng)建、幻燈片制作和編輯功能的,他們將這些功能整合在“文件生成與分析”之類的功能模塊中,但這個模塊的入口卻隱藏得很深——需要在設置欄的二級菜單里才能找到。因此,很少有用戶會發(fā)現(xiàn)并使用這個功能,然而在我看來,它依然是所有同類產(chǎn)品中,處理這類復雜任務的最佳選擇。所以,我很喜歡Claude,但如果它想真正成為一款面向大眾消費者的產(chǎn)品,就必須在易用性方面進一步“簡化”。你最近不是還看到一份關于美國青少年的調查報告嗎?
Justine Moore:沒錯。那份報告顯示,使用過Character AI的美國青少年數(shù)量,是使用過Claude的三倍之多。這個數(shù)據(jù)足以說明問題,覆蓋范圍確實很廣。
Olivia Moore:是啊。所以說,Claude雖然深受科技圈人士的喜愛,但在科技圈之外的大眾群體中,它的影響力可能還比較有限。
Anish Acharya:不過,Anthropic的一些產(chǎn)品設計確實很有意思。從美學設計、產(chǎn)品理念到工藝打磨這三個維度來看,Anthropic推出的三項功能——MCP(Model Context Protocol)、skills和命令行界面代碼功能(command line interface code),都算是出人意料的大膽嘗試,尤其是代碼功能。換作是我,可能會質疑:“命令行界面真的是用戶想要的交互方式嗎?”
Bryan Kim:我還以為你要提到他們推出的郵件功能(air mail)和思維帽功能(thinking cap)呢。沒錯,這兩個功能也很有意思,不過它們更偏向消費級應用。你剛才提到的這三個功能,確實都很有特點。
Anish Acharya:但這些功能的設計理念,確實都非常“高屋建瓴”。或許這么說有點為他們辯解的意思,但我確實覺得,這些有主見的設計,本身就是一種亮點。
Olivia Moore:我還挺想聽聽Justine對meta和Grok的看法的。我感覺這兩家公司,在今年都以各自獨特的方式,書寫了精彩的篇章。
Justine Moore:好的。先來說說meta。meta今年招募了大量頂尖研究人員,但我發(fā)現(xiàn),他們目前最強大的模型,其實并不是面向消費者的產(chǎn)品,而是SAM 3系列模型(ZP注:Segment Anything Model,萬物分割模型,可對圖像、視頻、音頻中的目標進行精準分割和追蹤)。以視頻模型為例,用戶上傳一段視頻后,可以用自然語言下達指令,比如“找到畫面中穿紅色T恤的小孩”,模型就能在整個視頻中對這個目標進行精準識別和追蹤,即便這個小孩多次進出畫面也不會丟失。同時,用戶還可以對目標應用各種特效,比如模糊處理、刪除等。同理,這個模型在音頻領域,可以對不同的音軌進行處理;在圖像領域,則可以對不同的物體進行操作。我希望明年能看到基于這些模型開發(fā)的、令人驚艷的消費級產(chǎn)品,但目前來看,它們更多還是停留在開發(fā)者工具的層面,尚未真正面向普通消費者。
Olivia Moore:考慮到meta這家公司的基因,這樣的情況確實有些出人意料。
Justine Moore:確實如此。不過,meta今年推出的AI功能中,有一項消費級功能做得非常不錯,那就是Instagram的AI翻譯功能。現(xiàn)在,用戶在上傳Reels短視頻時,可以選擇開啟翻譯功能。該功能會克隆用戶的聲音,將視頻內容翻譯成五種不同的語言,并用用戶自己的聲音進行配音,同時還會實現(xiàn)唇形同步。這項功能簡直太神奇了,能讓用戶聽起來就像是某個語言的母語者。我非常期待meta能在旗下產(chǎn)品中推出更多類似的功能。
再來說說Grok。Grok今年的發(fā)展速度堪稱驚人,無論是在Agent(companions)功能、LLM性能還是代碼生成能力上,都取得了巨大進步。尤其是在圖像和視頻生成領域,它的發(fā)展曲線是我見過的所有公司中最陡峭的——大約在六個月前,他們甚至還沒有推出圖像和視頻生成模型,但此后他們的功能更新速度就一發(fā)不可收拾:從最初的圖生視頻功能,到后來的文生視頻、音頻整合,再到語音唇形同步,以及15秒短視頻生成功能,他們的創(chuàng)新步伐從未放緩。Elon Musk也多次公開表示,希望Grok能推出更多具有互動性的視頻游戲類內容,并計劃在明年年底前實現(xiàn)用Grok生成電影的目標。希望他們能繼續(xù)保持這樣的發(fā)展速度。
Bryan Kim:你有沒有覺得,Grok的發(fā)展策略其實是一種“雙管齊下”的模式?一方面,他們在基礎模型層持續(xù)發(fā)力,力求在性能上達到行業(yè)頂尖水平;另一方面,他們又在娛樂領域積極布局。這種雙線并行的策略,確實很有意思。不過,就像我們之前討論的,Anthropic和ChatGPT面向的是大眾群體,但數(shù)據(jù)顯示Character AI的受歡迎程度要高得多。這就讓我不禁思考:我們應該如何看待這種現(xiàn)象?在我看來,Grok的這種雙軌策略,其實非常值得玩味。
Justine Moore:而且,Grok的圖像和視頻生成應用,從很早之前就開始采用模板化設計,推出了很多熱門創(chuàng)意模板。比如,“你站在某個場景中,突然從天花板垂下一根繩子,你抓住繩子,被迅速拉出畫面”這類模板。這些模板生成的內容,經(jīng)常會在TikTok等平臺上迅速走紅。
2026趨勢預測:機會窗口與發(fā)展方向
Anish Acharya:確實非常有意思。那么,我們不妨把話題從2025年切換到2026年,各位對明年有哪些預測呢?我們還沒有聊到硬件、模型以及電商領域,大家認為這些領域會有怎樣的發(fā)展態(tài)勢?
Olivia Moore:雖然我們討論的是消費級市場,但ChatGPT有一個點可能一直被低估了,而且這個點在明年或許會有更顯著的體現(xiàn)——那就是他們在企業(yè)級市場的大舉發(fā)力。無論是傳統(tǒng)的企業(yè)版授權,還是為特定企業(yè)定制訓練模型,ChatGPT都動作頻頻。我們知道,大多數(shù)消費者通常只使用一款通用LLM產(chǎn)品。而根據(jù)ChatGPT發(fā)布的一項大型研究報告顯示,其企業(yè)級用戶規(guī)模同比增長了七八倍。如果未來用戶出于工作需求,必須在公司使用ChatGPT,那么這很可能會進一步帶動其消費級用戶的增長。當然,另一種可能性是,ChatGPT憑借其連接器功能以及其他持續(xù)投入的功能,發(fā)展成為一個一站式的工作平臺,而消費級市場的各類應用場景則由其他產(chǎn)品來占據(jù)。說到這里,我們不得不提一下ChatGPT在應用生態(tài)上的布局,這一布局能否成功,將會成為決定他們明年發(fā)展走向的關鍵問題。
Anish Acharya:沒錯。我們都討論過應用SDK(ZP注:SDK,Software Development Kit,是軟件開發(fā)人員用于構建應用程序的工具集合)和他們所稱的應用程序目錄的重要性,這兩者將會成為消費級市場一個全新的重要渠道。但有一個點很少被提及,那就是它們對企業(yè)級市場也有著極高的相關性。ChatGPT的優(yōu)勢在于,它能夠在一個工作流程中整合多款工具協(xié)同運作。而回顧我們日常的工作場景,絕大多數(shù)任務其實都需要跨多款工具來完成。因此,這一布局將會對SaaS(ZP注:Software as a Service,一種通過互聯(lián)網(wǎng)提供軟件服務的模式)生態(tài)系統(tǒng)產(chǎn)生十分深遠的影響,而這也是目前應用商店領域中較少被探討的部分。
Bryan Kim:嗯,這或許算不上是一個嚴格意義上的預測,但回顧2025年,我們聊到了頭部實驗室的諸多重大舉措,而從初創(chuàng)企業(yè)的視角來看,今年最顯著的趨勢之一就是應用生成技術的興起。未來很有可能出現(xiàn)這樣一種情況:手握渠道分發(fā)優(yōu)勢且擁有高用戶活躍度的頭部實驗室,會開始嘗試在其自有產(chǎn)品生態(tài)內,幫助用戶生成那些具有共性的產(chǎn)品和應用。這一點其實很有意思,再次印證了我們之前提到的“產(chǎn)品創(chuàng)意供應鏈”的觀點。
另外還有一點,雖然算不上突破性的創(chuàng)新,但正如我們所知,“吉卜力風格”的生成效果曾經(jīng)火爆全網(wǎng)——我那位對科技一竅不通的表妹,當時都給我發(fā)來了一張用AI生成的吉卜力風格的照片。這充分說明了模板的重要性,風格的重要性。
再看視頻生成領域,現(xiàn)在的技術已經(jīng)相當成熟了。或許我們現(xiàn)在已經(jīng)進入了一個新階段——決定產(chǎn)品競爭力的,不再僅僅是頭部實驗室模型的性能,而是風格化的設計和模板的打造。就拿TikTok來說,其核心技術能力其實一直沒有太大變化,但憑借不斷迭代的音樂潮流、舞蹈挑戰(zhàn)等內容形式,始終保持著極高的新鮮感。因此,未來完全有可能出現(xiàn)這樣一種趨勢:開發(fā)者可以探索各種創(chuàng)新方式,在這些實驗室模型的基礎上,打造出真正以視頻為核心的產(chǎn)品。而且隨著技術成本的不斷下降,會有越來越多的人愿意去嘗試這類產(chǎn)品,我對此非常期待。
Justine Moore:是的,我最期待的趨勢其實也與此相關,那就是萬物皆可多模態(tài)化。我將其稱之為“任意輸入,任意輸出”。回想最初,尤其是在圖像和視頻生成模型剛剛興起時,用戶只能輸入文本Prompt,然后得到一張圖像或者一段視頻,無法進行更多復雜的操作。而現(xiàn)在,隨著Nano Banana、Flux以及OpenAI的新模型等圖像編輯工具的出現(xiàn),我們已經(jīng)能夠實現(xiàn)圖生圖的生成效果;也可以上傳一張參考圖像,搭配文本Prompt和生成方向,或者結合模板與另一張參考圖像,來生成新的圖像。
那么,未來如果我們輸入一段視頻,能否生成與之相關的圖像,或者這段視頻的衍生版本?如果我們輸入一段視頻,再配上一段描述編輯需求的文本Prompt,能否直接得到編輯后的視頻?從我與各大實驗室的交流來看,很多實驗室都在嘗試將他們目前在不同領域的研究成果進行整合——包括LLM領域的文本推理和智能交互能力,以及圖像和視頻生成領域的技術。他們試圖打造一個能夠處理多種類型內容輸入,并生成更加豐富多元內容的“超級模型”。這一趨勢也會對設計領域產(chǎn)生巨大的影響,因為設計工作本身就是將圖像、文本、視頻等多種元素,以富有創(chuàng)意的方式進行融合的過程。
Olivia Moore:如果讓我從宏觀層面做一個預測,明年的整體趨勢其實還是“萬變不離其宗”。回顧頭部實驗室今年在消費級市場推出的各類產(chǎn)品,他們在模型研發(fā)方面確實表現(xiàn)出色,同時也通過一些漸進式的功能更新,持續(xù)優(yōu)化ChatGPT、Gemini這類產(chǎn)品的核心用戶體驗。但在我看來,他們嘗試推出的數(shù)十款新的消費級產(chǎn)品或交互界面,比如群聊功能、Pulse功能、Atlas瀏覽器、Sora等,以及谷歌推出的Stitch、Gems、Opal、Doppel等一系列產(chǎn)品,幾乎都沒有取得理想的效果。這背后的原因在于,打造具有鮮明產(chǎn)品主張的獨立消費級AI產(chǎn)品,已經(jīng)不再是這些公司的核心競爭力所在。
在所有這些嘗試中,Notebook LM是表現(xiàn)相對較好的一款產(chǎn)品,但這款產(chǎn)品只是谷歌眾多嘗試中的一個。因此,這對于初創(chuàng)企業(yè)來說其實是一個非常積極的信號——頭部實驗室會持續(xù)優(yōu)化模型性能,初創(chuàng)企業(yè)可以直接借力這些先進的模型;同時,頭部實驗室會不斷完善ChatGPT這類核心產(chǎn)品,但他們未必能夠在所有細分應用場景中都占據(jù)主導地位,初創(chuàng)企業(yè)依然有很大的發(fā)展空間。
Bryan Kim:我基本同意你的觀點,但想補充一點。在純文本輸入輸出的場景下,ChatGPT、Gemini這類頭部實驗室的產(chǎn)品確實占據(jù)著絕對的優(yōu)勢。無論一款產(chǎn)品的文本輸出能力多么深入、多么精準,考慮到頭部實驗室產(chǎn)品的超高用戶活躍度,如果一款初創(chuàng)產(chǎn)品的核心功能只是文本輸入輸出,那么想要搶占用戶市場將會非常困難。因此,初創(chuàng)企業(yè)必須找到一個獨特的切入點,才有可能吸引用戶嘗試使用自己的產(chǎn)品。
Anish Acharya:你提到的“具有鮮明產(chǎn)品主張”這個說法,我非常認同。對于頭部實驗室來說,當然也包括大型科技公司,甚至未來可能會有更多實驗室加入這個行列,產(chǎn)品的優(yōu)先級往往是由晉升評審委員會來決定的。在這些公司里,產(chǎn)品經(jīng)理大多是處于職業(yè)生涯中期的從業(yè)者——我也曾是其中一員。在這樣的環(huán)境中,大家的核心目標都是獲得晉升,而獲得晉升的關鍵路徑,就是開發(fā)出能夠穩(wěn)定提升核心指標、完善核心功能的產(chǎn)品。因此,開發(fā)具有鮮明產(chǎn)品主張的產(chǎn)品,對于個人職業(yè)發(fā)展來說是一種風險極高的選擇。這類產(chǎn)品很可能會失敗,還可能引發(fā)一系列法律合規(guī)方面的問題,甚至可能招致CEO的斥責。所以,這些公司的組織架構,決定了他們更傾向于進行漸進式的創(chuàng)新。而初創(chuàng)企業(yè)的創(chuàng)始人越是敢于推出具有鮮明主張的產(chǎn)品,就越能形成差異化的競爭優(yōu)勢。
Justine Moore:沒錯。而且還有一個很重要的點我們沒有討論,那就是算力問題。頭部實驗室其實一直面臨著一個內在的矛盾:算力資源是有限的,他們必須在模型訓練和模型推理之間做出取舍。即便是在模型推理層面,也需要在“吉卜力風格”這類娛樂性應用場景和代碼生成這類智能應用場景之間進行資源分配。據(jù)我所知,在所有模型公司中,可能只有xAI目前沒有面臨算力瓶頸的問題。而其他公司則必須做出艱難且重大的抉擇——比如,如果他們推出Nano Banana并使其迅速走紅,那么這很可能會占用大量算力,從而延緩下一代大型語言模型的研發(fā)進度。而專注于應用層開發(fā)的初創(chuàng)企業(yè)則不會面臨這樣的問題,因為他們不存在這種算力資源分配的矛盾。
Anish Acharya:完全正確。我們之前其實也聊過這個話題。在某些細分領域,多模態(tài)技術的應用能夠讓企業(yè)為用戶提供更優(yōu)質的產(chǎn)品和服務。但從本質上來說,頭部實驗室和大型科技公司往往只支持自家的第一方模型。因此,隨著所有模型性能的不斷提升,或許單一模型就能滿足用戶80%的需求。但對于專業(yè)級用戶而言——AI領域的發(fā)展,很大程度上其實是由專業(yè)級用戶推動的——你之前總是說,專業(yè)級用戶終究只是專業(yè)級用戶。在AI時代到來之前,這個觀點或許是成立的,但現(xiàn)在,專業(yè)級用戶所能創(chuàng)造的價值深度和商業(yè)變現(xiàn)潛力,都已經(jīng)大大提升。因此,或許可以說,AI領域的發(fā)展,其實完全是由專業(yè)級用戶驅動的,而其他普通用戶,不過是流量而已。
Olivia Moore:沒錯。這也是為什么我們首次看到,消費級產(chǎn)品的收入留存率能夠超過100%。而這一指標,也成為了區(qū)分消費級AI領域中優(yōu)秀、卓越和頂尖產(chǎn)品的關鍵標準。
Justine Moore:需要說明的是,這種高收入留存率的實現(xiàn)方式,通常是在訂閱制收費的基礎上,疊加按使用量收費的模式。用戶在訂閱套餐的月度配額之外,如果有額外的使用需求,就需要支付更多費用。
Bryan Kim:具體來說,要么是升級到更高等級的訂閱套餐,要么是直接購買Token或額外的使用額度。這正是這類產(chǎn)品的獨特之處。如果在AI時代到來之前,有人告訴我某家消費級公司的收入留存率超過100%,并且實現(xiàn)了盈利,我肯定會覺得這簡直不可思議,完全不合邏輯。
Anish Acharya:沒錯,說的就是這個意思,而且這個雙關語用得恰到好處。好了各位,我們不妨聊聊具體的產(chǎn)品推薦吧。在本期播客結束之后,大家覺得有哪些產(chǎn)品、功能或者模型是值得用戶下載和體驗的?當下有哪些值得關注的產(chǎn)品?
Justine Moore:從多模態(tài)技術的角度來看,有一款非常被低估的產(chǎn)品值得大家關注——它就是Pomelli。這款產(chǎn)品未必適合日常高頻使用,但它充分展示了將Agent、圖像和文本技術相結合所能實現(xiàn)的巨大潛力。Pomelli是谷歌實驗室推出的一款產(chǎn)品,用戶只需輸入自己公司的網(wǎng)址,它就會啟動Agent訪問該網(wǎng)站,抓取所有的產(chǎn)品圖片和品牌圖片,總結出品牌的美學風格、品牌定位以及目標客戶群體,然后為用戶生成三套不同的廣告營銷方案。生成的內容不僅包括文案,還涵蓋了Instagram帖子、宣傳單頁以及產(chǎn)品宣傳圖等物料,并會根據(jù)目標客戶群體的特點,為這些物料匹配最合適的應用場景。這是一款非常出色的產(chǎn)品,它很難在谷歌內部發(fā)展成為一款獨立的爆款產(chǎn)品,但它向我們展示了未來的發(fā)展方向——當Agent與生成式模型相結合,并且生成式模型能夠對上下文語境形成深度理解時,所能創(chuàng)造的價值將是傳統(tǒng)圖像或視頻模型無法比擬的。
Olivia Moore:那初創(chuàng)企業(yè)的產(chǎn)品呢?你有沒有特別喜歡的初創(chuàng)企業(yè)開發(fā)的創(chuàng)意工具類產(chǎn)品?
Justine Moore:有的。在創(chuàng)意工具領域,我必須要提一下Krea。需要聲明的是,a16z是Krea的投資方,所以我的推薦可能帶有一定的主觀偏向,但我確實認為Krea做得非常出色。它的核心優(yōu)勢在于,用戶可以在一個平臺上,體驗到所有主流模型——或者說所有高性能模型——在各個模態(tài)下的生成效果,同時它還在這些模型的基礎上,打造了更加完善的交互界面。比如,我現(xiàn)在更傾向于在Krea平臺上使用Nano Banana Pro,因為Krea支持元素保存功能——用戶可以將生成的角色、風格或物體保存為元素,后續(xù)生成時只需直接調用這些元素即可,而無需像在原生的Nano Banana中那樣,反復上傳相同的參考圖像。這確實是一個非常實用的功能。
Bryan Kim:我想推薦的這款產(chǎn)品,同樣屬于初創(chuàng)企業(yè)的范疇——當然,這也算是為自家投資的公司做宣傳了。我目前使用頻率最高的產(chǎn)品是11 Labs Reader。這款產(chǎn)品的走紅其實是有原因的:如今播客內容呈爆發(fā)式增長,而人們的閱讀時間卻在不斷減少。與其抗拒這個趨勢,不如主動擁抱它。這款產(chǎn)品的核心功能,就是將文字內容轉化為音頻內容。我曾經(jīng)是Pocket這類稍后閱讀工具的重度用戶,因為平時實在沒有時間閱讀所有感興趣的內容,只能先收藏起來。而現(xiàn)在,我的做法是將所有想讀的內容,要么轉換成PDF格式,要么直接上傳到11 Labs Reader。然后在散步的時候,以1.5倍速或2倍速播放這些音頻內容,快速了解文章的核心大意。對于像我這樣的普通人來說,這無疑是一種高效利用碎片化時間的方式。
Olivia Moore:首先,我非常喜歡這個問題。因為我始終堅信,想要快速了解AI領域的發(fā)展動態(tài),最有效的方式就是親自體驗大量的產(chǎn)品,而且你很快就會形成自己的判斷。我和Justine其實從12月開始,就在推特上每天推薦一款新的消費級AI產(chǎn)品。除此之外,我還想推薦三款非常實用且有趣的產(chǎn)品,它們可以很好地融入大家的日常工作流。第一款是Gamma,一款幻燈片生成工具。用戶只需輸入文本Prompt,或者上傳一份文檔,就能快速生成精美的幻燈片。而且Gamma生成的幻燈片支持靈活調整尺寸,再也不用像在Google Slides中那樣,為了調整一個元素的位置而反復折騰。第二款是Granola,一款筆記工具。雖然大家在假期可能沒有太多會議,但到了明年,它的優(yōu)勢就會凸顯出來——你使用它記錄的會議越多,它的體驗就會越好,因為它能夠基于歷史記錄,理解會議內容的上下文語境。最后一款,我還是要推薦Comet瀏覽器。如果你想體驗一款真正的AI原生工作平臺,那么Comet瀏覽器絕對是最容易上手的選擇之一。
Anish Acharya:對我來說,我今年一整年都在癡迷于代碼生成以及AI代碼領域,這個領域真的太有趣了。順便提一下,Bryan之前其實反駁過我的觀點,我當時認為頭部實驗室或大型科技公司很難在應用生成領域占據(jù)主導地位,因為他們缺乏足夠的專注力。像Opal這類產(chǎn)品,推出時反響平平,而且它們都只支持單一模型。
Bryan Kim:我當時的意思并不是說頭部實驗室會在這個領域取得成功,而是認為他們肯定會進行相關的嘗試。
Anish Acharya:沒錯,這一點我完全同意。但在純消費級市場領域,Wabby這款產(chǎn)品確實非常有趣,而且功能強大。它為應用生成技術設定了合理的約束條件,從而能夠確保生成的應用具備實用的功能,給用戶帶來滿意的體驗。目前來看,應用生成領域其實存在很多夸大宣傳的現(xiàn)象,這也打擊了早期用戶的積極性。另外,我還想推薦大家嘗試一下Codex或Cursor中的GPT-5.2,即便是非技術用戶,也會被它的能力驚艷到。我甚至覺得,具備技術背景反而可能成為一種束縛,因為你會基于自己的經(jīng)驗,對模型的能力形成預設,而實際上這些模型的潛力要遠超你的想象。我越來越多地聽到有人說,他們正在使用Cursor來完成知識型工作,比如撰寫論文,而不僅僅是編寫代碼。
Bryan Kim:哇,這個用法太有意思了。在今年年底,我還想嘗試一個最近在TikTok上很火的玩法——就是讓AI回顧你今年說過的所有話,然后回答“我今年說過的最離譜的一句話是什么”。它會對你全年的言論進行一次全面的復盤。受此啟發(fā),我打算在年底也讓AI幫我做一件事——讓它告訴我,如何才能在明年過上更好的生活。我希望它能給我一些坦誠直率的建議和具體的方向,這會非常有幫助。
Anish Acharya:各位,還有什么收尾的想法嗎?
Justine Moore:最想說的一點是,a16z目前正在積極投資消費級AI領域的初創(chuàng)企業(yè)。很多人其實都提到過這一點,但我是真心相信,現(xiàn)在模型的性能已經(jīng)發(fā)展到了一個臨界點——開發(fā)者完全可以基于這些模型,打造出真正具備規(guī)模化潛力的應用,Wabby就是一個絕佳的例子。因此,我衷心希望2026年能夠成為消費級AI應用開發(fā)者大放異彩的一年——這里所說的“開發(fā)者”,不僅僅是指產(chǎn)品的使用者,更是指那些打造產(chǎn)品的創(chuàng)業(yè)者。
Anish Acharya:好的,感謝大家在消費級AI領域陪我們度過了精彩紛呈的一年。我們明年再會,祝大家圣誕快樂!新年快樂!
原文:Where does consumer AI stand at the end of 2025?
https://www.youtube.com/watch?v=p4-7x6QiYr0
編譯:Yihan Bi









