meta公司近日宣布推出其超級智能實驗室的首個產品——Muse Spark,這標志著該公司在人工智能領域邁出了重要一步。作為一款閉源專有模型,Spark被定位為對meta現有AI體系的全面升級,與之前表現平平的開源Llama系列形成鮮明對比。公司創始人馬克·扎克伯格特別強調,雖然Spark采取閉源策略,但Muse系列未來仍會包含新的開源模型。
在技術突破方面,meta重點介紹了"沉思模式"這一創新功能。該模式通過協調最多16個智能體并行推理,在保持響應速度的同時顯著提升了性能表現。在"人類最終考試"基準測試中,配備外部工具的沉思模式取得了58.4分的優異成績。技術博客透露,這種多智能體協作方式正在逐步向用戶開放。
針對此前Llama系列在強化學習應用上的不足,Spark在預訓練后增加了專門的強化學習階段。通過引入"思考時間懲罰"機制,模型在保證推理多樣性的前提下,實現了性能穩定性的提升。特別值得注意的是,在AIME 2025基準測試中,模型展現出獨特的"相變"現象——經過訓練后能用更少的Token完成同等準確的推理,后續版本在保持更高準確率的同時,總耗時反而減少。
伴隨模型發布,meta同步更新了其"高級AI擴展框架",聲稱該模型在所有已測量的前沿風險類別中均處于安全范圍。具體安全細節將在即將發布的《安全與準備報告》中披露。目前用戶可通過meta AI應用及官方網站體驗Spark,精選合作伙伴已獲得私有預覽API權限。公司計劃在未來數周內,將服務擴展至WhatsApp、Messenger等主流平臺,并應用于AI眼鏡等硬件設備。
基準測試數據顯示,Spark的標準思考模式在多項指標上已達到或超越OpenAI、Anthropic等競爭對手的水平。不過meta坦承,在長周期智能體系統和編程工作流等領域仍存在性能差距,將持續投入資源進行優化。這種實事求是的態度,或許正是meta在AI競賽中尋求突破的關鍵所在。













