前DeepSeek研究員、現任小米MiMo大模型團隊負責人羅福莉,近期在資源管理領域取得重要突破。其主導研發的統一資源管理系統ARL-Tangram,通過與北京大學科研團隊聯合攻關,成功構建出基于動作級公式的創新架構,為異構資源調度提供了全新解決方案。
該系統的核心突破在于彈性調度算法的優化設計。研究團隊通過建立統一的數學模型,使系統能夠動態適配不同類型計算資源的約束條件,在保證任務執行質量的前提下,將動作完成時間(ACT)指標提升最高達4.3分。實驗數據顯示,在強化學習訓練場景中,該技術可將單步訓練時長壓縮至原有水平的66.7%,同時減少71.2%的外部資源調用需求。
這項成果標志著羅福莉在小米任職期間的第二項重大技術突破。早在2024年10月,她就以核心作者身份參與小米AI團隊與北京大學的合作研究,在MoE架構與強化學習融合領域發表首篇論文。此次新系統的問世,進一步鞏固了其在人工智能基礎設施領域的學術影響力。
在2025年小米人車家全生態合作伙伴大會上,羅福莉首次以小米研究員身份公開亮相。她在社交平臺分享的職業感悟引發行業關注:"當智能技術突破語言邊界,真正融入物理世界時,我們正在見證人機協同的新紀元。在MiMo團隊,一群懷揣熱忱的科研人員正在共同描繪AGI的實踐藍圖。"
據技術白皮書披露,ARL-Tangram系統已進入小米內部測試階段,首批應用場景涵蓋自動駕駛訓練、智能家居優化等跨領域任務。該系統的模塊化設計支持快速適配不同業務需求,其資源調度效率的顯著提升,為大規模AI模型的工業化部署提供了關鍵技術支撐。











