京東探索研究院近日宣布,其自主研發的圖像編輯模型JoyAI-Image-Edit正式面向全球開源。這一突破性成果標志著AI圖像處理技術從二維平面編輯向三維空間重塑的跨越,為開發者提供了可直接應用的開源工具鏈。
該模型創新性地構建了空間智能體系,通過整合空間位置解析、多視角一致性維護、相機參數感知等核心技術模塊,實現了相機視角轉換、物體空間位移旋轉、幾何結構精準控制等復雜操作。經第三方測試驗證,其在物體移動精度、空間邏輯連貫性等關鍵指標上已達到國際領先水平,成功突破了傳統開源模型在三維空間理解方面的技術瓶頸。
JoyAI-Image-Edit的三大核心功能尤為突出:其一,視角變換功能支持用戶通過自然語言指令調整相機偏航角、俯仰角及縮放比例,在保持場景幾何結構完整的前提下生成新視角圖像;其二,空間漫游功能可連續生成邏輯連貫的多視角圖像序列,模擬三維空間中的移動觀察效果;其三,物體空間關系操控功能允許對特定物體進行位移、縮放等操作,同時自動優化遮擋關系與光影效果,確保場景整體協調性。
在空間編輯能力之外,該模型還兼容15類通用圖像編輯功能,涵蓋物體替換、風格遷移、細節優化等高頻創作需求。其全開源特性包含完整的推理代碼庫,開發者可基于現有框架快速開發各類應用,顯著降低三維圖像處理的技術門檻。
目前,該模型已在電商內容生產、創意設計、智能圖像處理、3D模型重建等領域展開應用測試。特別是在具身智能視覺感知領域,其提供的空間建模能力為機器人環境理解、虛擬場景構建等前沿技術提供了關鍵支撐,有望推動相關領域的技術迭代與產業升級。









