近日,全球最大API聚合平臺(tái)OpenRouter上,一款代號(hào)為“Hunter Alpha”的神秘大模型引發(fā)廣泛關(guān)注,其曾一度登頂大模型調(diào)用榜,眾多網(wǎng)友紛紛猜測(cè)它是“DeepSeek V4”的早期版本。就在眾人熱議之時(shí),小米于凌晨正式宣布認(rèn)領(lǐng)該模型,并同步推出MiMo-V2-Pro、Omni和TTS三款大模型,用戶可限時(shí)免費(fèi)體驗(yàn)一周。
小米MiMo大模型負(fù)責(zé)人羅福莉隨后發(fā)布長(zhǎng)文,稱這是小米首款專為智能體時(shí)代打造的全棧產(chǎn)品系列。她將此次成果形容為一次“悄無(wú)聲息的伏擊”,強(qiáng)調(diào)并非小米事先精心策劃,而是從聊天模式到智能代理模式的轉(zhuǎn)變太過(guò)迅速,連團(tuán)隊(duì)自身都感到意外,這一過(guò)程既充滿激動(dòng)與痛苦,又極具吸引力。
據(jù)羅福莉介紹,1T基礎(chǔ)模型早在幾個(gè)月前就已開(kāi)始訓(xùn)練,最初目標(biāo)是提升長(zhǎng)上下文推理效率。團(tuán)隊(duì)采用的混合注意力機(jī)制帶來(lái)了真正創(chuàng)新,既不過(guò)度擴(kuò)張,又成為智能體時(shí)代最合適的基石。該模型具備1M上下文窗口,通過(guò)MTP推理實(shí)現(xiàn)了超低延遲和成本。這些架構(gòu)決策并非臨時(shí)起意,而是在需求出現(xiàn)前就構(gòu)建好的結(jié)構(gòu)性優(yōu)勢(shì)。
真正帶來(lái)變革的是羅福莉首次體驗(yàn)復(fù)雜智能體框架時(shí),她將其稱為“精心編排的語(yǔ)境”。體驗(yàn)第一天,她就大為震驚,并試圖說(shuō)服團(tuán)隊(duì)采用,但未獲成功。于是她下達(dá)強(qiáng)硬指令,要求MiMo團(tuán)隊(duì)成員第二天對(duì)話次數(shù)必須超過(guò)100次,否則可辭職。這一舉措奏效,團(tuán)隊(duì)成員的想象力被智能體系統(tǒng)的功能激發(fā)后,直接轉(zhuǎn)化為研究速度的提升。
當(dāng)被問(wèn)及小米為何能發(fā)展如此迅速時(shí),羅福莉結(jié)合自身構(gòu)建DeepSeek R1的經(jīng)驗(yàn)總結(jié)道:骨干網(wǎng)和基礎(chǔ)設(shè)施研究周期漫長(zhǎng),需要一年戰(zhàn)略決心才能看到回報(bào);訓(xùn)練后敏捷性是不同能力,產(chǎn)品直覺(jué)驅(qū)動(dòng)評(píng)估,迭代周期縮短,范式轉(zhuǎn)變能及早發(fā)生;同時(shí),好奇心、敏銳技術(shù)直覺(jué)、果斷執(zhí)行力和全身心投入不可或缺;還有一點(diǎn)常被低估,即對(duì)所創(chuàng)造世界的真摯熱愛(ài)。
羅福莉還承諾,新的MiMo-V2系列模型在足夠穩(wěn)定、值得開(kāi)源時(shí)將會(huì)開(kāi)源。










