全球最大API聚合平臺OpenRouter上,一款代號為“Hunter Alpha”的神秘大模型近期引發廣泛關注。該模型在本月一度登頂大模型調用榜,其性能表現引發網友諸多猜測,不少人認為它可能是“DeepSeek V4”的早期版本。
今日凌晨,小米正式宣布“Hunter Alpha”為其旗下產品,并同步推出MiMo-V2-Pro、Omni和TTS三款大模型。這三款模型目前開放限時一周的免費體驗,用戶可通過指定渠道進行申請。
小米MiMo大模型負責人羅福莉隨后發布長文,詳細闡述了產品研發背后的故事。她表示,這是小米首款專為智能體時代打造的全棧產品系列,其研發過程充滿挑戰與驚喜。從聊天模式到智能代理模式的快速轉變,讓團隊經歷了既激動人心又痛苦不堪的研發階段。
據羅福莉介紹,1T基礎模型的訓練工作早在幾個月前就已啟動,最初目標是提升長上下文推理效率。團隊通過引入混合注意力機制,在保證創新性的同時避免了過度擴張。該模型具備1M上下文窗口,并采用MTP推理技術實現超低延遲和成本。這些架構決策并非臨時起意,而是團隊提前布局的結構性優勢。
研發過程中,一個復雜的智能體框架給團隊帶來深刻影響。羅福莉將其描述為“精心編排的語境”,首次體驗時就讓她感到震驚。為推動團隊接受這一框架,她甚至下達強硬指令:要求團隊成員每日對話次數必須達到100次以上。這一舉措成功激發了團隊的想象力,并直接轉化為研究效率的提升。
在分享研發經驗時,羅福莉強調了多個關鍵因素。她指出,骨干網和基礎設施研究需要長期戰略決心,通常需要一年時間才能看到回報。同時,訓練后的敏捷性也至關重要,這包括產品直覺驅動評估、縮短迭代周期以及及早實現范式轉變。好奇心、技術直覺、執行力和全身心投入也是不可或缺的要素。
對于開源計劃,羅福莉表示,新的MiMo-V2系列模型將在確保足夠穩定后進行開源。這一承諾體現了小米對技術共享和社區建設的重視,也為開發者提供了更多期待。










