國家數據局局長劉烈宏在國新辦新聞發布會上透露,為破解高質量數據集建設規模有限、分布零散等瓶頸,國家數據局聯合26個部門啟動專項行動,通過遴選104個典型案例構建新型建設生態。該模式以行業龍頭企業為"鏈主",聯合科研機構、技術企業等多方主體,形成聯合攻關、共建共享的協同機制,有效推動數據資源整合與開放應用。
針對人工智能發展對數據要素的迫切需求,國家數據局明確提出"人工智能延伸到哪里,數據集建設就覆蓋到哪里"的戰略導向。通過建立跨部門協作機制,重點突破數據標準不統一、流通機制不健全等關鍵問題,為模型訓練提供標準化、規模化的數據支撐。目前,已形成覆蓋智能制造、智慧醫療、智能交通等20余個重點領域的高質量數據集體系。
據最新統計數據顯示,截至2025年底,全國累計建成的高質量數據集總量突破10萬個大關。這些數據集日均Token調用量呈現指數級增長態勢,直接帶動大模型訓練效率提升40%以上。在醫療領域,基于海量病例數據訓練的AI輔助診斷系統,已實現97%的常見病識別準確率;在工業場景,設備故障預測模型的響應速度較傳統方式縮短60%。
業內專家指出,數據集建設的規模化突破標志著我國人工智能發展進入新階段。通過構建"需求牽引-供給匹配-應用反饋"的閉環生態,既解決了數據孤島問題,又激發了市場主體創新活力。目前,該模式已形成可復制推廣的經驗,正在向金融、教育、能源等領域加速延伸,為數字經濟高質量發展注入新動能。











