京東探索研究院近日宣布,其自主研發的圖像編輯模型JoyAI-Image-Edit正式對外開源。這一模型首次將空間智能理念深度融入技術框架,使人工智能系統突破傳統平面圖像處理局限,實現了對三維空間關系的精準理解與動態編輯。開發者現可獲取完整推理代碼,直接應用于各類場景開發。
該模型通過構建空間位置關系、多視角一致性、相機參數感知等核心模塊,成功攻克了三維空間編輯的技術瓶頸。實驗數據顯示,其在物體移動精度、空間結構一致性等關鍵指標上已達到國際領先水平。不同于傳統模型對空間關系的模糊處理,新系統能夠精確控制相機視角變換、物體空間位移旋轉等復雜操作,甚至實現幾何結構的毫米級調整。
三大核心功能構成技術突破的關鍵支點:視角變換功能允許用戶通過自然語言指令調整相機偏航角、俯仰角及縮放比例,在保持場景幾何完整性的同時生成新視角圖像;空間漫游功能支持連續視角移動,可自動生成邏輯連貫的多視角圖像序列,模擬三維空間中的自然移動軌跡;物體空間關系操控功能則能在保持場景整體結構穩定的前提下,對特定物體進行位移、縮放等變換,并自動優化遮擋關系與光影效果。
在空間智能突破的基礎上,模型還整合了15類通用圖像編輯能力,覆蓋內容創作全流程需求。從物體替換、刪除、添加等基礎操作,到風格遷移、細節精修等高級功能,系統均表現出優異的處理性能。這種"空間+平面"的雙重編輯能力,使模型能夠適應從簡單圖像處理到復雜3D重建的多樣化應用場景。
技術落地層面,該模型已在多個領域展現應用價值。在電商領域,可自動生成多角度商品展示圖;創意設計行業能快速實現三維場景構建;智能圖像處理領域可完成復雜空間關系的修復與重構;3D模型重建效率得到顯著提升;具身智能視覺感知系統則獲得了更精準的空間理解能力。特別在機器人視覺導航等具身智能場景中,模型提供的底層空間感知能力為技術研發開辟了新路徑。











