在人工智能領域,具身智能正成為備受矚目的新賽道,被視為萬億級規模的潛力市場。然而,當前這一前沿技術產業化進程面臨關鍵瓶頸——機器人雖在運動控制等“小腦”能力上持續突破,但決策推理的“大腦”部分,即具身大模型,因缺乏真實場景數據支撐,難以實現從實驗室到產業場景的深度落地。
為破解這一行業難題,京東宣布啟動全球最大規模的具身智能數據工程。依托零售、物流、健康、工業等領域的超級供應鏈體系,以及覆蓋外賣配送、家政服務等多元場景的生態優勢,京東將構建覆蓋全產業鏈的數據采集網絡。該項目計劃在兩年內積累超1000萬小時的高質量人類活動數據,涵蓋視覺、觸覺、空間軌跡等多維度信息,為具身大模型提供“燃料級”訓練素材。
在數據采集體系構建上,京東已形成完整技術閉環。其行業領先的機器人數據采集中心,整合了“采集—標注—訓練—驗證”全流程能力,重點覆蓋物流倉儲、工業制造、健康醫療、家庭服務、城市運維五大核心場景。通過部署智能傳感器網絡,系統可同步記錄環境數據與機器人本體運行數據,形成“人類行為+機器響應”的雙重數據集。
這場數據革命的獨特之處在于其規模化與場景化雙重特征。京東將動員超60萬參與者構建數據采集網絡,包括10萬名內部員工及50萬名外部行業人員。在江蘇宿遷試點項目中,當地10萬市民將參與覆蓋家庭、辦公、工廠、物流等超百個細分場景的數據采集,形成從個人生活到產業生產的完整數據圖譜。所有數據采集均嚴格遵循法律法規,通過匿名化處理與技術脫敏保障隱私安全。
根據規劃,京東將在首年完成500萬小時視頻數據積累,兩年內突破1000萬小時大關,同時采集100萬小時機器人本體運行數據。這一數據規模相當于連續114年不間斷記錄人類活動,將徹底改變行業“數據荒”現狀。通過推動“大腦”決策系統與“小腦”運動控制系統的協同進化,具身智能模型將獲得理解復雜場景、做出精準決策的核心能力,真正實現從“感知世界”到“認知世界”的跨越。








