在人工智能飛速發(fā)展的當(dāng)下,詞元——這一大模型處理信息的最小單元,正成為智能經(jīng)濟(jì)領(lǐng)域的關(guān)鍵要素。我國日均詞元調(diào)用量呈現(xiàn)出爆發(fā)式增長態(tài)勢,不僅彰顯出智能經(jīng)濟(jì)的蓬勃活力,更預(yù)示著一套全新的商業(yè)邏輯正在加速形成。隨著詞元可計量、可定價、可交易的特性日益凸顯,人工智能有望如同水、電一般,成為支撐社會運(yùn)轉(zhuǎn)的基礎(chǔ)資源。
今年3月,中國人工智能大模型交出了一份亮眼成績單:日均詞元調(diào)用量突破140萬億,短短兩年間增長超千倍。如此驚人的增長速度,引發(fā)了各界對詞元的廣泛關(guān)注。那么,究竟什么是詞元?它與人工智能產(chǎn)業(yè)有著怎樣的緊密聯(lián)系,未來又將朝著怎樣的方向發(fā)展呢?記者就此展開了深入采訪。
詞元與常見的數(shù)據(jù)有著本質(zhì)區(qū)別。文字詞元宛如“樂高積木”,一個單詞或漢字被拆解成一個個獨(dú)立的詞元;音頻詞元恰似“樂譜上的音符”,一段聲音被切割成極短的時間片段,每個片段都蘊(yùn)含著音調(diào)、音量等信息;視頻詞元則如同“拼圖碎片”,每一幀畫面被分割成一個個小方格,同時還要兼顧時間上的連續(xù)性。火山引擎智能算法負(fù)責(zé)人吳迪形象地比喻道:“在大模型眼中,三種模態(tài)的詞元毫無差異,它只將它們視為一串極其復(fù)雜的數(shù)字序列進(jìn)行處理。”
這些看似微小的詞元,實(shí)則是智能經(jīng)濟(jì)運(yùn)行的“細(xì)胞”。今年3月,中國人工智能大模型周詞元調(diào)用量連續(xù)三周位居全球前列,成為全球大模型應(yīng)用活躍度最高的國家之一。詞元調(diào)用量之所以出現(xiàn)爆發(fā)性增長,首要原因在于模型能力的顯著提升。每一次模型能力的進(jìn)步,都會解鎖更多應(yīng)用場景,進(jìn)而推動大模型詞元調(diào)用量進(jìn)一步激增。以Seedance(豆包視頻生成模型)2.0為例,生成1分鐘視頻大約需要消耗超過100萬個詞元。
除了模型能力的提升,新的應(yīng)用形態(tài)和商業(yè)模式也為詞元調(diào)用量的大幅上漲提供了強(qiáng)大動力。例如,近期興起的智能體與傳統(tǒng)單輪問答截然不同,其運(yùn)行過程涉及更長的上下文、更頻繁的模型調(diào)用、更多輪次的任務(wù)拆解,以及工具執(zhí)行過程中的持續(xù)反饋。吳迪介紹,簡單任務(wù)若只需單輪或幾輪工具調(diào)用即可完成,消耗詞元僅需幾千;而若需要幾十輪工具調(diào)用,則至少要消耗幾萬詞元甚至更多。智能體等新業(yè)態(tài)的涌現(xiàn),無疑為詞元調(diào)用量開辟了快速增長的新通道。
從行業(yè)分布來看,詞元調(diào)用量主要集中在信息密度高、產(chǎn)品迭代周期快的領(lǐng)域。以豆包大模型2.0為例,在行業(yè)分類中,互聯(lián)網(wǎng)行業(yè)詞元調(diào)用比例最高,消費(fèi)電子、金融、新零售和商務(wù)服務(wù)緊隨其后。在應(yīng)用場景方面,非結(jié)構(gòu)化信息的處理和分析占比最大,教育、內(nèi)容創(chuàng)作和“搜索與推薦”次之。展望未來,軟件開發(fā)、深度研究、個人助理等智能體應(yīng)用場景有望成為詞元調(diào)用量爆發(fā)的重要領(lǐng)域。特別是軟件開發(fā)領(lǐng)域,當(dāng)前人工智能正從簡單寫代碼向理解整個項目轉(zhuǎn)變,不僅能排查錯漏、自動優(yōu)化,甚至能通過智能體自主完成整個開發(fā)任務(wù)。由于代碼上下文長、交互輪次多,企業(yè)為提升效率的付費(fèi)意愿較強(qiáng),這將成為巨大的需求增長點(diǎn)。
詞元的可計量特性,為人工智能產(chǎn)業(yè)的發(fā)展帶來了全新的商業(yè)邏輯。國家數(shù)據(jù)局相關(guān)負(fù)責(zé)人透露,今年1月底以來,部分模型企業(yè)創(chuàng)下了20天收入超越2025年全年總收入的業(yè)績紀(jì)錄。這背后,正是一套以詞元計費(fèi)為基礎(chǔ)的新型商業(yè)邏輯在加速演進(jìn)。回顧人工智能產(chǎn)業(yè)發(fā)展歷程,過去行業(yè)主要聚焦于模型性能的比拼,技術(shù)創(chuàng)新與商業(yè)落地之間缺乏可量化的銜接橋梁,難以形成“技術(shù)迭代—價值產(chǎn)出—持續(xù)投入”的良性循環(huán)。而詞元具備可計量、錨定算力能耗、跨模態(tài)通用結(jié)算的特點(diǎn),使其能夠成為連接技術(shù)供給與商業(yè)需求的結(jié)算單位。聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略管理總監(jiān)黃山打了個比方:“大模型輸出的智能好比電,智算中心好比發(fā)電廠,電用千瓦時來計量,智能調(diào)用就用詞元來計費(fèi)。”展望未來的智能社會,人工智能有望像水、電一樣,實(shí)現(xiàn)隨取隨用、按需購買。
從詞元的角度出發(fā),我國在打造智能經(jīng)濟(jì)新形態(tài)方面具備諸多優(yōu)勢。在算法創(chuàng)新領(lǐng)域,國產(chǎn)大模型通過底層架構(gòu)優(yōu)化,與全球頂尖技術(shù)的差距逐漸縮小。我國大模型廠商積極開展算法創(chuàng)新,在推理成本、響應(yīng)速度上不斷優(yōu)化,能夠以更少的詞元完成復(fù)雜任務(wù)。在基礎(chǔ)設(shè)施方面,我國擁有全球門類最全、規(guī)模最大的能源體系,電源充足、電網(wǎng)強(qiáng)大、市場活躍。隨著發(fā)電供給持續(xù)提升、電力成本不斷降低,能夠有效降低詞元調(diào)用成本。能耗和算力是詞元調(diào)用的兩個關(guān)鍵成本,讓每個詞元用更少的算力和能耗生產(chǎn)出來,體現(xiàn)的是智算中心等基礎(chǔ)設(shè)施的生產(chǎn)能力和效率。因此,構(gòu)建安全、高效、普惠的人工智能基礎(chǔ)設(shè)施,持續(xù)提升大模型推理效率、降低單個詞元成本,將推動人工智能最大程度走向規(guī)模化應(yīng)用落地。







