舊金山初創公司Moonlake AI近日宣布,其“世界建模智能體”已進入公開測試階段。該團隊同步發布的技術博客詳細拆解了保齡球小游戲的十階段開發流程:從3D網格資產生成、剛體物理參數配置、碰撞檢測算法搭建,到計分系統邏輯編寫、空間音頻融合及逆向運動學抓取動畫實現,全程由AI自主完成。其beta版本產品能在15至20分鐘內,將自然語言描述轉化為具備物理反饋、可交互操作的完整游戲原型。
區別于傳統游戲生成工具,Moonlake的野心不止于簡化開發流程。創始人Fan-Yun Sun與Sharon Lee明確表示,該項目旨在通過游戲開發過程訓練具備“世界運行規律”理解能力的AI模型。這種定位源于團隊核心成員的學術背景:Fan-Yun Sun在斯坦福攻讀博士期間,同時參與英偉達Omniverse項目,專注于大規模3D世界生成;Sharon Lee則深耕擴散模型與3D引擎的結合,致力于構建空間理解基礎模型。兩人的研究領域形成閉環——前者解決虛擬世界構建,后者賦予世界交互能力。
2025年10月,該公司結束隱身模式并宣布完成2800萬美元種子輪融資,由AIX Ventures、Threshold Ventures及英偉達旗下NVentures聯合領投。其天使投資人陣容堪稱豪華:YouTube聯合創始人Steve Chen、Google首席科學家Jeff Dean、GAN發明者Ian Goodfellow,以及來自Hugging Face、DeepMind等機構的高管均參與投資。截至近期,融資總額已增至約3000萬美元,團隊規模約15人,成員包括ACM ICPC獎牌得主及國際奧賽獲獎者。
2025年12月發布的核心理念產品Reverie(生成式游戲引擎GGE),被團隊定義為首個“可編程世界模型”。其突破性在于實現狀態持久性——區別于Sora等視頻生成模型僅預測下一幀畫面的模式,Reverie通過綁定擴散模型與結構化3D信號,確保虛擬世界中的變化能夠長期維持。例如,玩家打碎的花瓶不會在幾秒后自動復原。Sharon Lee在采訪中強調:“生成式世界缺失的關鍵是控制權,創作者需要定義變化的觸發條件、持續時間及影響范圍。”
技術架構層面,Reverie采用“編排者”模式而非單一模型。當用戶輸入自然語言指令后,系統會調用多個專業化第三方AI模型分工處理:空間布局由多模態推理模型完成,游戲邏輯依賴程序合成技術,物理交互通過模擬層實現,視覺渲染則交給實時擴散模型。Fan-Yun Sun透露,編排模型會隨時間推移逐步整合外部模型能力,形成自主融合多模態數據的系統。
官方博客以賽博朋克風格保齡球游戲為例,展示系統推理流程:用戶僅提供“在街機房創建半寫實賽博朋克保齡球游戲”的簡短描述后,AI自動完成十個開發階段——從生成球道、球瓶的3D網格及PBR紋理,到配置摩擦系數0.4、彈性0.15的物理參數;從設計空間布局與核心游戲邏輯,到管理球體生命周期、處理邊界異常、集成音頻及逆向運動學抓取系統,最終通過用戶反饋優化細節。整個過程無需人工干預架構設計或代碼編寫。
Moonlake對“世界模型”的定義顯著區別于行業主流。當前多數AI項目將“world model”簡化為視頻幀預測,如Google DeepMind的Genie 3可生成24幀/秒的3D導航環境,李飛飛團隊推出的Marble能從文本生成3D世界。而Moonlake認為,世界狀態不能被壓縮為像素集合。以保齡球瓶為例,其同時是空間中的紋理物體、具備質量慣性的剛體、可被撞倒的目標、計分符號實體及撞擊聲源。球擊中瓶子的瞬間,需同步更新變換矩陣、解析碰撞沖量、遞增比分、觸發音頻及推進重置計時器——任何模態的延遲都會導致世界不連貫。
基于此,團隊提出世界模型需編碼五大維度:幾何(變換、拓撲、空間關系)、物理(質量、力、碰撞約束)、可供性(可行動作及執行主體)、符號邏輯(規則、分數、狀態機)及感知映射(視覺投影與空間音頻)。這一框架更接近傳統游戲引擎的實際功能,而非單純追求視覺真實。
實際測試顯示,Reverie可快速生成游戲原型,但精細化打磨仍需人工介入。Fast Company記者在體驗中,首次嘗試制作3D地牢探險游戲失敗,僅生成布滿膠囊形角色的單房間場景;改做2D冰淇淋堆疊游戲時,初版雖在15分鐘內完成核心玩法,但存在物理效果缺陷——冰淇淋無法正確堆疊,廚師角色顯示為白色粗糙圖形。經過數小時反復調整需求,最終版本雖實現計分與結束畫面,但消耗了月度1500信用點中的950點(按40美元月費計算約25美元)。
Moonlake的長期目標超越工具開發。團隊強調,用戶每次糾正物理行為、補充游戲規則或調整因果關系,都在為多模態模型提供訓練數據。Fan-Yun Sun對比現有數據采集方式指出:激光掃描房間獲取的是靜態數據,視頻分析缺乏人類語境,單一游戲數據(如《堡壘之夜》錄像)難以泛化至真實世界。而用戶交互天然包含意圖與反饋,屬于因果數據。若用戶基數形成規模,數據量將呈指數級增長,推動模型能力持續提升。目前,團隊已收到制造業企業的咨詢,探索將技術應用于機器人訓練、自動駕駛及人因分析領域。不過,其beta版每日僅開放100個測試名額,距離構建數據飛輪仍有較大差距。






