當地時間4月8日,meta公司正式推出多模態推理模型Muse Spark,這款被視為其AI戰略轉型關鍵成果的新模型,標志著meta在人工智能領域的技術路線發生重大調整。與以往開源的Llama系列不同,Muse Spark采用閉源模式開發,引發業界對meta技術戰略轉向的廣泛討論。美股當日收盤時,meta股價上漲6.5%,市場對這一戰略調整給予積極回應。
根據meta官方披露的技術文檔,Muse Spark在多模態感知、復雜推理和代理任務處理等方面展現出較強競爭力。在多模態基準測試CharXiv Reasoning中,該模型以86.4分的成績超越GPT-5.4(82.8分)和Gemini 3.1 Pro High(80.2分)。不過在視覺理解等其他測試項目中,其表現略遜于Gemini 3.1 Pro High。在代理能力專項測試DeepSearchQA中,Muse Spark取得74.8分的成績,優于Gemini 3.1 Pro High的69.7分和GPT-5.4的73.6分。
值得關注的是,meta透露尚未上線的沉思模式在專業領域測試中表現更為突出。在無工具Humanity’s Last Exam和FrontierScience Research兩項測試中,該模式得分均超過Gemini 3.1和GPT-5.4 Pro。這種"思考模式"與"沉思模式"的雙軌設計,顯示出meta在通用人工智能與專業領域突破之間的戰略平衡。
這場戰略轉型始于去年4月的Llama 4爭議。當時該模型被質疑訓練數據存在偏差,實際性能未達預期,加之首席AI科學家楊立昆的技術路線爭議,促使meta管理層啟動全面改革。去年6月,meta以近150億美元投資AI初創公司Scale AI,其創始人亞歷山大·王出任超級智能實驗室負責人,隨后展開大規模人才招募計劃。
組織架構調整伴隨技術路線的根本性轉變。據內部人士透露,新管理層更傾向于采用經過驗證的技術方案,將研發重心轉向大語言模型開發,對部分前沿創意持謹慎態度。這種轉變直接體現在Muse Spark的閉源策略上,與Llama系列形成鮮明對比。楊立昆的離職被視為這種戰略轉向的標志性事件,其后續公開表示,meta管理層在技術方向上存在顯著分歧。
在模型研發之外,meta同步推進AI基礎設施建設。公司計劃到2026年將資本支出翻倍至1150-1350億美元,主要用于數據中心擴建和算力提升。這種激進投入使meta成為美國科技公司中AI基礎設施投入力度最大的企業之一,為其模型訓練和迭代提供硬件保障。
當前AI市場競爭日趨白熱化。Anthropic公司近日宣布其未發布模型Mythos Preview在編碼能力上取得突破,可能重塑網絡安全格局。市場傳言OpenAI計劃在4月推出GPT-6,而DeepSeek同日更新的對話界面新增"快速模式"和"專家模式",被解讀為V4版本上線的前奏。這些動態表明,meta的新模型將面臨激烈的市場檢驗。
技術評測顯示,Muse Spark在部分基準測試中超越Anthropic的Opus 4.6,但整體仍未形成全面優勢。這種"局部領先、整體追趕"的態勢,反映出當前AI模型競爭的復雜格局。隨著頭部企業陸續推出新一代產品,2024年第二季度可能成為大模型技術突破的關鍵窗口期。






