近日,全球最大API聚合平臺OpenRouter上,一款代號為“Hunter Alpha”的神秘大模型引發廣泛關注,其一度登頂大模型調用榜,引發網友諸多猜測,不少人認為它可能是“DeepSeek V4”的早期版本。
就在眾人熱議之際,小米在19日凌晨正式宣布認領“Hunter Alpha”,并推出三款大模型——MiMo-V2-Pro、Omni和TTS,用戶可限時免費體驗一周。這一消息瞬間在科技圈掀起波瀾,大家紛紛將目光投向小米的這一新動作。
小米MiMo大模型負責人羅福莉隨后發布長文,詳細闡述了相關情況。她表示,這是小米首款真正為智能體時代打造的全棧產品系列。她將此次成果的呈現形容為一次悄無聲息的伏擊,并非小米事先精心策劃,而是從聊天模式到智能代理模式的轉變速度之快,連團隊自身都感到意外,期間經歷了既激動人心又充滿挑戰的過程。
據羅福莉介紹,1T基礎模型早在幾個月前就已開始訓練,最初的目標是提升長上下文推理的效率。團隊采用的混合注意力機制帶來了真正的創新,既不過度擴張,又恰好成為智能體時代最合適的基石。該模型具備1M上下文窗口,通過MTP推理實現了超低延遲和成本。這些架構決策并非臨時起意,而是在需求出現之前就構建好的結構性優勢。
真正讓一切發生改變的,是羅福莉第一次體驗到復雜的智能體框架,她稱之為“精心編排的語境”。體驗的第一天,她就深感震驚,并試圖說服團隊采用,但未能成功。于是她下達強硬指令,要求MiMo團隊成員第二天對話次數少于100次的可以辭職。這一舉措成效顯著,團隊成員的想象力被智能體系統的功能激發后,直接轉化為研究速度的提升。
當被問及小米為何發展如此迅速時,羅福莉結合自身構建DeepSeek R1的經歷給出了總結。她認為,骨干網和基礎設施研究周期漫長,需要一年左右的戰略決心才能看到回報;訓練后敏捷性是另一種能力,它由產品直覺驅動評估,能縮短迭代周期,促使范式轉變盡早發生;好奇心、敏銳的技術直覺、果斷的執行力以及全身心的投入也至關重要;還有一點容易被低估,那就是對所創造世界的真摯熱愛。
羅福莉還承諾,新的MiMo-V2系列模型在足夠穩定、值得開源的時候將會開源,這一消息也讓眾多開發者充滿期待。











