月之暗面公司近日宣布開源其最新人工智能模型K2.5,這一消息在AI領域引發廣泛關注。該模型在復雜任務處理能力上實現重大突破,能夠自主協調多達100個子智能體組成的集群,并行執行最高1500次工具調用。這種創新架構使任務執行效率較單智能體模式提升最高達4.5倍,且整個集群的創建與協調完全由模型自動完成,無需人工預設工作流程。
在基準測試中,K2.5展現出卓越性能。在綜合推理、瀏覽交互和深度搜索問答三個Agent基準測試中均取得領先成績;編碼能力方面,在多語言編程測試中位居榜首;文檔理解測試中以88.8分刷新紀錄。特別值得注意的是,該模型在保持與GPT-5.2相近性能的同時,成本顯著降低,這種性價比優勢使其在商業應用中更具競爭力。外網技術專家評價稱,K2.5集成了開源領域最先進的推理、視覺處理和長上下文處理能力。
針對軟件開發場景,月之暗面同步推出編程產品Kimi Code。這款可直接在終端運行的產品支持與主流開發工具集成,具備圖像視頻輸入處理能力,并能自動識別現有技能進行遷移。其API定價策略頗具吸引力:輸入每百萬Token收費4元,緩存輸入0.7元,輸出每百萬Token收費21元。這種定價模式為開發者提供了經濟高效的選擇。
K2.5提供四種操作模式:快速模式適用于需要即時響應的場景;思考模式專門處理復雜問題;Agent模式擅長生成各類辦公文檔;集群模式則針對需要并行處理的復雜任務。在視覺編程領域,該模型展現出獨特優勢,能夠將簡單對話轉化為具有專業設計水準的前端界面,甚至通過上傳錄屏視頻就能重建完整網頁。這種能力源于其大規模視覺-文本聯合預訓練,使視覺與文本處理能力同步提升。
在辦公自動化方面,K2.5取得顯著進展。該模型能夠處理高密度、大規模的辦公任務,包括解析復雜文檔、協調多步驟工具使用,并直接生成專業級輸出成果。內部測試顯示,其辦公輸出質量較前代模型提升近60%,在財務模型構建、學術論文綜述等高級任務中表現突出。例如,該模型曾成功將40篇社會心理學論文綜述任務分解,最終生成包含完整引用的100頁學術文檔。
實際應用案例充分展示了K2.5的強大能力。在處理大規模并行任務時,模型集群可同時研究100個細分領域并找出頂尖YouTube創作者;僅憑一張結婚照就能生成符合文化背景的全球婚禮旅行方案;在文獻處理方面,能將200多篇文章按主題分類并生成結構化摘要。這些案例證明,K2.5已具備處理企業級復雜工作流程的實力,為知識工作自動化提供了新的解決方案。











