近期,“詞元”成為科技與經濟領域熱議的焦點,一組令人矚目的數據將其推至公眾視野——今年3月,我國日均詞元調用量突破140萬億次。從2024年初的1000億次,到2025年底的100萬億次,再到如今的140萬億次,短短兩年間,這一數字實現了超千倍的增長,不僅展現了技術發展的速度,更映射出我國人工智能產業的蓬勃生機。
詞元,作為人工智能大模型處理信息的“基本單元”,類似于人類讀寫中的“字”。當AI處理數據時,會將復雜信息拆解為可操作的詞元,這些詞元可以是單個漢字、標點符號,或是一個詞語片段。無論是向AI提問,還是利用AI生成內容,每一次交互都伴隨著詞元的調用。這一概念雖專業,卻與每個人的生活息息相關。
日均140萬億次的調用量,首先反映了人工智能應用的廣泛普及。詞元調用頻率越高,意味著AI技術越深入地融入日常生活與各行各業。從教師利用AI輔助備課,到農民借助AI診斷農作物病蟲害;從小微企業通過AI優化供應鏈,到普通用戶使用AI處理文案、編輯圖片,AI的應用場景不斷拓展,功能日益強大。這種普及不僅提升了效率,更改變了人們的生活與工作方式,背后是用戶與企業對AI技術的信任,以及我國人工智能應用生態的成熟。
詞元調用量的激增,也是人工智能產業商業化進程的重要信號。每一次詞元的調用,都涉及算力、算法與電力的消耗。算力的提升能加快詞元處理速度、降低成本;算法的優化則能提高生成內容的質量,進而增加調用頻次;穩定的電力供應與低成本,則進一步降低了詞元的生產與調用成本。在人工智能產業鏈中,詞元成為衡量各環節成本與效率競爭力的關鍵指標,也被視為智能時代的“價值錨點”。其可計量、可定價、可交易的特性,使其成為連接技術與商業的“結算單位”,為人工智能服務的“按詞元計費”模式奠定了基礎,推動了技術的商業化落地。
詞元調用量的增長,還標志著數據要素價值的加速釋放。人工智能的發展離不開數據的支撐,而詞元的海量調用,背后是高質量數據集的持續擴充。截至2025年底,我國已建成超10萬個高質量數據集,總體量超過890PB。這些數據通過拆解為詞元,被AI處理與應用,最終轉化為生產力,為模型迭代與應用落地提供了堅實支撐。國家數據局局長劉烈宏指出,日均詞元調用量的大幅增長,表明我國數據要素市場化配置改革取得顯著成效,人工智能高質量數據的供給體系正在形成,“數據供給—價值釋放”的良性循環已初步顯現。










