春節前夕,國產AI大模型領域迎來新一輪激烈競爭,DeepSeek、智譜、字節跳動等企業紛紛推出模型更新。其中,MiniMax-M2.5的正式上線引發行業關注,該模型在Agent智能體與編程能力方面實現顯著突破。
據MiniMax AI工程團隊在海外社交平臺披露,研發過程中隨著訓練計算資源的持續投入,模型性能呈現階梯式提升。團隊負責人幽默表示,既期待產品盡快發布以便回家過年,又為效果優化帶來的延遲感到糾結。目前用戶已可在平臺選擇使用M2.5版本。
在實測環節,該模型展現出突出的網頁開發能力。當要求制作蘋果公司投資分析儀表盤時,系統不僅完整呈現財務健康度、技術面分析等核心指標,還通過動態圖表實現數據可視化交互。用戶鼠標懸停即可查看具體數值,SWOT分析模塊的詳細程度超出預期。更令人驚喜的是,輸入簡單指令即可生成可運行的"黃金礦工"網頁游戲,包含完整的關卡設計和音效系統。
專業文檔生成方面,模型展現出強大的結構化處理能力。在梳理AI開源推理生態的測試中,其輸出的6000字報告采用表格對比不同框架特性,內容詳實度獲得認可。針對AI 3D建模工具開發需求,系統自動生成包含用戶畫像、功能需求、運營路徑的多維度文檔,關鍵信息覆蓋率達90%以上。
PPT制作測試出現有趣現象,為提升內容吸引力,模型創造性地運用比喻修辭手法。在講解唐代歷史時,將長安城比作現代一線城市,用"朋友圈"概念解釋文人社交,這種年輕化表達方式顯著增強了內容親和力。不過在版式設計精細度方面仍有改進空間,部分圖表存在對齊偏差問題。
定時任務執行暴露出信息時效性短板。在科技新聞摘要任務中,系統抓取的8條資訊均來自2025年舊聞,未能滿足24小時內新鮮資訊的要求。雖然內容總結準確,但已喪失新聞核心價值。TikTok趨勢分析任務表現相對較好,不僅識別出熱門挑戰和音頻標簽,還能根據平臺特性給出內容創作建議。
視頻生成測試顯示,模型對復雜場景的理解能力有待加強。當要求制作特定犬種的運動視頻時,雖然畫面氛圍和背景元素還原準確,但主角犬種出現偏差。不過在物體運動軌跡和光影效果處理上,已達到行業中等水平。
資本市場對技術突破反應迅速,MiniMax股價在消息公布后單日漲幅達14.62%,盤中最高沖至23.5%,公司總市值突破1600億元人民幣。根據港交所披露,企業將于3月初發布年度財務報告,屆時可能公布更多技術商業化進展。
從行業視角觀察,Agent能力與編程開發已成為大模型競爭的核心賽道。雖然MiniMax-M2.5在多個場景展現實用價值,但測試結果顯示其輸出結果仍需人工校對,需求理解準確率存在波動。這種"可用但需優化"的狀態,恰是當前AI技術發展的普遍特征。





