2024年的中國AI圈,Kimi曾是聚光燈下的焦點。憑借10億美元融資、概念股漲停潮以及號稱支持200萬字輸入的模型,這家初創公司一度被貼上“技術顛覆者”標簽。然而,行業很快發現,這個實驗性模型單次運行成本高達三位數,根本無法支撐大規模應用。技術圈對此嗤之以鼻,但Kimi憑借“長文本”概念成功搶占用戶心智,在商業宣傳戰中占據先機。
轉機出現在2025年7月。當多數企業還在模仿DeepSeek的“深度思考”模型時,Kimi突然發布K2模型,將戰略重心轉向Agent能力開發。這個能自主調用工具、編寫代碼的模型,被英國《自然》雜志譽為“中國AI領域的第二個DeepSeek時刻”。Anthropic聯合創始人Jack Clark在博客中指出,盡管K2比美國最前沿技術落后數月,但其工具調用能力已達到實用水平。
商業價值隨之爆發。K2.5發布后20天收入超過去年全年,被估值3500億美元的編程工具Cursor套殼使用,全球最大獨立AI搜索Perplexity將其作為唯一中國開源模型引入。英偉達更是在GTC大會上連續兩年將Kimi模型作為新一代芯片的演示標桿,CEO黃仁勛直言這是“重新定義推理性能的標準”。
資本市場的態度發生180度轉變。2026年3月,Kimi完成180億美元估值融資,份額遭機構瘋搶。據內部人士透露,公司當前最大瓶頸是算力不足,現有GPU資源僅能滿足十分之一的市場需求。這種“有多少卡就能轉化多少收入”的困境,反而成為投資機構加注的理由——某大廠為在編程工具中接入Kimi模型,甚至需要提前三個月預購算力額度。
回看2025年初的至暗時刻,Kimi的逆襲并非偶然。在被唱衰期間,公司秘密研發的Moonlight小型MoE模型,驗證了二階優化器技術的可行性,最終成為支撐萬億參數K2模型的核心架構。這項突破促使行業棄用沿用十年的Adam優化器,包括GLM-5、DeepSeek Engram在內的新模型紛紛跟進。
中國AI雙雄的競爭格局正在重塑。DeepSeek憑借MLA注意力機制和極致能效比路線,在2025年證明非硅谷路徑的可行性;Kimi則通過Agent能力突破實現彎道超車。兩家公司不約而同地選擇挑戰神經網絡底層架構——DeepSeek的Engram模型正在測試動態稀疏激活技術,Kimi的注意力殘差機制已引發學術界大規模復現研究。
這場持續三年的AI革命遠未結束。當行業還在爭論Chat與Agent誰代表未來時,中國公司已經用代碼和論文給出答案:從優化器到注意力機制,從訓練范式到推理架構,每個技術層都存在重構空間。正如Kimi創始人楊植麟在英偉達大會上的宣言:“我們正在拆除深度學習時代的腳手架,為真正的通用智能重建地基。”








