飛捷科思智能科技(Fysics AI)近日宣布推出全球首款面向真實物理世界的全模態物理人工智能基礎模型OmniFysics,該模型通過構建物理感知與因果推理機制,致力于破解生成式人工智能領域長期存在的“物理常識缺失”難題。傳統生成式模型雖能生成逼真圖像或流暢對話,但在處理重力、摩擦力等基礎物理規律時,常出現物體懸浮、液體倒流等違背常識的錯誤。
區別于依賴海量視覺數據訓練的傳統路徑,OmniFysics采用30億參數的輕量化架構,創新性地整合了“靜態中樞”與“動態中樞”雙數據生態。前者通過解析物體材質、密度等靜態屬性,建立物理參數數據庫;后者則捕捉聲音、運動等動態信號,構建物理因果關系圖譜。這種設計使模型不僅能識別陶瓷的易碎性、液體的流動性等特征,還能通過撞擊聲推斷物體材質,實現從像素生成到物理參數反演的跨越。
技術實現層面,研發團隊設計了四階段漸進式訓練方案:首先分別強化視覺、聽覺等單模態感知能力,隨后通過跨模態對齊實現多維度數據融合,最終構建統一的物理推理框架。這種訓練策略既保證了模型在特定任務上的專業性,又提升了處理復雜物理場景的協同能力。例如,當輸入“玻璃杯墜落”的指令時,模型不僅能生成符合物理規律的破碎畫面,還能準確計算沖擊力、碎片分布等參數。
為驗證模型的實際效能,研究團隊同步開發了Fysicseval評估體系。該基準測試包含物理屬性預測、因果邏輯推理、跨模態一致性驗證三大模塊,通過設置“重物自動上升”“液體凝固飛行”等反常識場景,量化評估模型對物理規律的掌握程度。實驗數據顯示,OmniFysics在物體質量估算、運動軌跡預測等任務中的準確率較傳統模型提升47%,在復雜物理場景推理任務中表現尤為突出。
這項突破為具身智能的發展提供了關鍵技術支撐。傳統人工智能系統多停留于語義理解層面,而OmniFysics通過建立物理參數與感官信號的映射關系,使機器能夠像人類一樣感知世界物理特性。研究團隊透露,該模型已初步應用于工業仿真、機器人控制等領域,未來計劃進一步拓展至災害預測、科學實驗等需要嚴格物理約束的場景。











