月之暗面公司CEO楊植麟以一種不同尋常的方式發布了Kimi最新模型K2.5——沒有坐在豪華的辦公桌前,也沒有精致的背景布置,他直接站在鏡頭前,用中英文雙語向全球用戶介紹了這款新模型。K2.5被定位為當前最強大的全能模型,集視覺、文本、對話、智能體(agent)以及思考能力于一身,并且以開源形式發布,標志著AI模型領域迎來了一次重要突破。
在競爭激烈的AI模型市場中,K2.5憑借其卓越的性能脫穎而出。根據測試數據,該模型在HLE、BrowseComp和DeepSearchQA等高難度智能體評測中表現優異,刷新了現有紀錄。在編程能力方面,K2.5在SWE-bench Verified測試中取得了76.8分,顯著縮小了與頂尖閉源模型的差距。它在視覺理解任務中也展現了領先水平,進一步鞏固了其全能模型的地位。
K2.5的核心亮點不僅在于其強大的性能,更在于其獨特的設計理念。月之暗面公司一直以算法研究和產品創新能力著稱,而K2.5正是這一理念的集中體現。該模型首次引入了視覺能力,能夠基于圖片和視頻進行理解和推理。同時,它采用了“all in one”架構,將多模態、文本處理、快速回答、代碼生成和智能體功能整合在一個模型中,實現了真正的全能化。
在產品化方面,K2.5也帶來了多項創新。例如,它將視覺和編碼能力結合,支持用戶通過自然語言和視覺編輯方式完成創作和開發任務。用戶可以直接上傳產品視頻,讓模型拆解并復刻,或者在生成的UI上進行圈改,輕松完成設計和開發工作。Kimi還推出了Kimi Code,支持在終端運行,并可集成到VSCode、Cursor等主流編輯器中,提供編程輔助功能,甚至能夠自動遷移現有技能到新工作流中。
K2.5的另一大亮點是其多智能體(multi-agent)能力,目前處于測試階段。用戶可以選擇“Agent集群模式”,讓模型同時調度多達100個智能體并行或串行工作,完成復雜任務。這些智能體本質上是K2.5的“分身”,各自承擔不同角色和子任務,且角色分配和任務拆解完全由模型即時決定,無需預設規則。這一功能為處理高并發、大批量和多樣性任務提供了全新思路。
在技術實現上,K2.5采用了并行智能體強化學習(PARL)方法進行訓練。該方法包括一個可訓練的編排智能體和多個動態實例化的凍結子智能體,前者負責拆解任務并分配子任務,后者負責執行。為解決并行與串行結合時的潛在問題,Kimi設計了分階段獎勵塑形機制,在訓練早期鼓勵并行,后期逐步轉向任務成功。這一創新使得端到端運行時間縮短了80%,并支持更復雜的長周期任務負載。
K2.5的多模態能力也體現了月之暗面對用戶需求的深刻理解。公司不僅為模型補充了視覺功能,還通過大量訓練提升了其“美學品味”,幫助用戶擺脫AI生成的模板化內容。同時,K2.5強化了意圖理解能力,簡化了交互流程,讓用戶無需陷入復雜的提示詞工程中。例如,用戶只需用自然語言描述需求,模型即可生成高質量的網頁代碼,真正實現了AI的“普惠”價值。
月之暗面公司自成立以來,始終保持著獨特的創新風格,甚至帶有一些“中二”氣質和熱血感。在K2.5的多智能體功能中,這一特點尤為明顯——模型為不同智能體賦予了充滿個性的名字,增添了一絲趣味性和人性化。這種不拘一格的設計理念,讓K2.5在技術突破的同時,也展現了AI模型的另一種可能性。






