具身智能作為人工智能領域的前沿方向,正加速從實驗室走向產業化應用。然而,當前行業面臨一個關鍵瓶頸:機器人運動控制技術(“小腦”)已取得顯著進展,但決策系統的核心——具身大模型(“大腦”)卻因缺乏真實場景數據支撐,難以實現技術深度落地。這一矛盾正制約著整個產業的規模化發展。
為突破這一困境,京東宣布啟動全球最大規模的具身智能數據采集工程。依托其覆蓋零售、物流、健康、工業等領域的超級供應鏈體系,以及20余年積累的多元化業務場景,京東將構建覆蓋五大核心領域(物流倉儲、工業制造、健康醫療、家庭服務、城市運維)的全維度數據采集網絡。該網絡不僅記錄視覺、觸覺等基礎數據,更通過空間軌跡追蹤等技術,完整捕捉人類與物理世界的交互過程。
項目實施將采用“雙軌制”數據采集模式:一方面,京東將調動內部超10萬名員工參與數據采集,覆蓋從倉儲分揀到醫療護理等職業場景;另一方面,通過開放平臺吸引外部行業人員加入,計劃在宿遷等試點城市動員超10萬市民參與,最終形成覆蓋超百個細分場景、50萬人規模的采集網絡。所有數據采集均嚴格遵循法律法規,確保隱私保護與合規性。
京東同步搭建了行業首個“采集-標注-訓練-驗證”全流程數據流水線。通過這一體系,項目計劃在首年積累500萬小時人類真實場景視頻數據,兩年內突破1000萬小時,同時采集100萬小時機器人本體運行數據。這些數據將形成具身智能領域的“燃料庫”,推動行業從算法仿真階段邁向真實數據驅動的新范式。
業內專家指出,京東的獨特優勢在于其場景數據的“全真性”與“連續性”。不同于實驗室環境下的片段式數據,京東采集的數據源自真實業務流程,能夠反映動態環境中的復雜決策需求。這種數據特質將助力具身大模型突破“看”與“動”的基礎能力,向“理解”真實世界的認知智能躍遷,為機器人進入家庭、工廠、醫院等場景奠定技術基礎。








