滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

PearlError-包含視頻過濾

時間：2026-04-09 18:09:12 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

作者｜冬梅

Alexandr Wang 帶隊，

meta 新模型深夜來襲

沉寂了 9 個月后，這位讓扎克伯克花了 143 億美元挖來的天才少年 Alexandr Wang 終于交出了首個作品。

昨夜，meta 正式發布新一代模型 Muse Spark，代號 Avocado，就是外界傳了很久的“牛油果”。這是其內部 AI 組織 meta Superintelligence Labs 在戰略重組后的首個落地產品，也被視為這家科技巨頭邁向“個人超級智能”路線圖的起點。

Alexandr Wang 甚至激動地在 X 上連發九條推文介紹該模型。

與此前側重語言能力的模型不同，Muse Spark 從一開始就被定義為“原生多模態推理模型”。它不僅能夠處理文本，還能理解圖像、環境信息，并在此基礎上進行推理、調用工具，甚至與其他智能體協同完成復雜任務。

這種能力組合，意味著 meta 正試圖將 AI 從“對話工具”升級為“行動系統”。

Muse Spark 的發布，并非一次單點技術升級，而更像是 meta AI 戰略的一次整體轉向。

過去一年，meta 在 AI 領域經歷了明顯的路徑調整。從開源導向的 Llama 系列，到如今強調“超級智能”的閉環系統能力，核心變化在于：不再單純追求模型能力本身，而是強調“模型 + 工具 + 環境 + 多智能體”的系統級協同。

Muse Spark 正是這一思路的首個成型產品。

官方披露，為支撐這一方向，meta 正在對整個技術棧進行重構，包括模型訓練、數據管理以及底層基礎設施。其中，名為 Hyperion 的新一代數據中心被明確點名，成為未來大規模模型擴展的關鍵支撐。

性能媲美 Gemini Pro 和 GPT 5.4

在能力層面，Muse Spark 的核心突破集中在“多模態推理”。

meta 在官方博客中表示：“在過去的九個月里，我們徹底重建了人工智能堆棧，速度比以往任何開發周期都要快。這個初始模型的設計初衷就是體積小、速度快，但卻足以應對科學、數學和健康領域的復雜問題。這是一個強大的基礎，下一代模型已經在開發中。”

據介紹，meta 還發布了“思考模式”，該模式可協調多個智能體并行推理。這使得 Muse Spark 能夠與 Gemini Deep Think 和 GPT Pro 等前沿模型的極限推理模式相媲美。“思考模式”顯著提升了 Muse Spark 在挑戰性任務中的能力，在“人類最后的考試”任務中取得了 58% 的完成率，在“前沿科學研究”任務中取得了 38% 的完成率。

不同于傳統視覺模型僅能識別圖像內容，Muse Spark 被設計為能夠將視覺信息與推理過程深度融合。例如，在 STEM 問題、物體識別與空間定位等場景中，它不僅能“看見”，還能“理解并推導”。

這種能力使其可以直接參與實際任務。例如：

通過攝像頭分析家電狀態，并用動態標注輔助用戶排查故障

根據視覺輸入生成互動內容，如小游戲或教學演示

在復雜環境中進行實時決策輔助

更關鍵的是，Muse Spark 支持“可視化思維鏈”（visual chain-of-thought），即將推理過程以可視形式呈現。這一設計不僅提升了可解釋性，也為復雜任務的人機協作提供了新的交互范式。

meta 此次特別強調了 Muse Spark 在健康領域的應用潛力。

據介紹，meta 與超過 1000 名醫生合作構建訓練數據，使模型在健康推理上具備更高的專業性與可靠性。基于這一能力，Muse Spark 可以生成帶交互界面的分析結果，例如：

食物營養結構的可視化拆解

運動過程中肌肉激活情況的動態展示

個性化飲食建議（結合用戶健康狀況）

這類能力的本質，是將 AI 從“信息提供者”升級為“決策輔助系統”。

在技術層面，meta 把另一個重點放在“擴展效率”上。

官方披露，在過去九個月中，團隊重構了預訓練體系，包括模型架構、優化方法和數據管理流程。結果是：在達到相同性能的前提下，Muse Spark 所需的訓練計算量（FLOPs）相比上一代模型（如 Llama 4 Maverick）下降了一個數量級以上。

這一結果具有明確的行業意義。

過去兩年，大模型競爭很大程度上依賴“堆算力”。而 meta 此次強調的，是通過工程優化提升“單位算力產出”。換句話說，其試圖證明：性能增長不必完全依賴指數級資源投入。

提示：你能把它轉換成一個我可以在網上玩的數獨游戲嗎？

技術實現細節完整披露

在官方技術博客中，meta 詳細介紹了他們如何從三個維度研究和追蹤 Muse Spark 的擴展特性：預訓練、強化學習和測試時推理。

預訓練。在預訓練階段，Muse Spark 獲得其核心的多模態理解、推理和編碼能力——這是強化學習和測試時計算的基礎。

meta 重構了預訓練堆棧，改進了模型架構、優化和數據管理。這些改進共同提升了其利用每一單位計算資源所能達到的性能。為了嚴格評估新方案，meta 研發團隊對一系列小型模型擬合了一個擴展定律，并比較了達到特定性能水平所需的訓練浮點運算次數（FLOPs）。結果顯而易見：與之前的模型 Llama 4 Maverick 相比，他們用少一個數量級以上的計算資源就能達到相同的性能。這一改進也使得 Muse Spark 比目前可供比較的領先基礎模型效率更高。

強化學習。經過預訓練后，強化學習 (RL) 利用計算能力可擴展地提升模型性能。盡管大規模強化學習歷來容易出現不穩定，但 meta 的新技術棧能夠帶來平穩、可預測的性能提升。

下圖展示了擴展 Muse Spark 的強化學習 (RL) 計算能力（以步數衡量）所帶來的益處。左圖顯示，在訓練數據上，pass@1 和 pass@16（16 次嘗試中至少成功一次）的數值呈對數線性增長。這表明強化學習在不影響推理多樣性的前提下提高了模型的可靠性。右圖顯示，在預留的評估集上準確率的增長表明，強化學習帶來的收益具有可預測的泛化能力：Muse Spark 在訓練中未遇到的任務上也表現良好。

測試時推理。強化學習訓練模型在回答問題前進行“思考”——這一過程被稱為測試時推理。要讓數十億用戶擁有這種能力，就需要高效利用推理令牌。為此，研發團隊依靠兩個關鍵手段：一是思考時間懲罰，用于優化 token 使用；二是多智能體編排，用于在不降低響應速度的前提下提升性能。

為了在每個 token 上實現最高的智能水平，強化學習訓練在增加思考時間的前提下，最大化正確率。在諸如 AIME 等部分評估任務中，這會導致階段性轉變。在初始階段，模型通過延長思考時間來提升性能；之后，思考時間的懲罰會促使模型進行思維壓縮——Muse Spark 會壓縮其推理過程，從而使用更少的 token 解決問題。壓縮之后，模型會再次擴展其解決方案，以獲得更強的性能。

為了在不顯著增加延遲的情況下，將更多時間用于測試時的推理，可以擴展協作解決難題的并行智能體的數量。下圖展示了這種方法的優勢。標準的測試時擴展方法會使單個智能體思考更長時間，而采用多智能體思維的 Muse Spark 擴展方法則可以在保持相當延遲的情況下實現更高的性能。

在安全層面，meta 表示已在部署前對 Muse Spark 進行系統性評估，依據其更新后的“高級人工智能擴展框架”（Advanced AI Scaling framework），對威脅模型、評估流程及上線標準進行了統一規范。

評估重點覆蓋前沿風險（如生物與化學領域）、行為一致性以及對抗魯棒性，并在安全措施實施前后進行對比測試。結果顯示，Muse Spark 在涉及高風險內容時表現出明顯的拒絕傾向，這主要得益于數據過濾、后訓練安全對齊及系統級防護的多層機制。

meta 同時指出，在網絡攻擊或“失控”場景中，當前模型尚不具備執行復雜威脅任務的自主能力。整體來看，Muse Spark 在已評估的風險范圍內處于可控水平，更多細節將于后續《安全與準備報告》中披露。

網友：模型強不強不知道，

但閉源讓人失望

Muse Spark 的發布在技術社區引發了巨大反響，Stability AI 創始人 Emad Mostaque 及 meta 前首席科學家 Yann LeCun、Coinbase 聯創兼 CEO Brian Armstrong 等大佬紛紛在 x 上向 Alexandr Wang 和 meta 表示祝賀。

另一方面，普通網友和部分開發者則聚焦于實際應用層面相關問題展開了爭論。

有網友表示，該模型在排行榜上的表現令人印象深刻，但好奇 meta 是否也會在智能體編碼領域展開競爭？

還有網友表示，新模型的多代理編排部分很有意思，Muse Spark 能原生處理這個問題，是一個真正的突破。他寫道：“我一直在單體倉庫的不同模塊上運行并行的 Claude Code 代理，協調開銷非常大。如果 Muse Spark 能原生處理這個問題，對于大型代碼庫的復雜重構來說，這將是一個真正的突破。”

有網友認為，meta 能在短時間內構建出性能如此強大的模型，為以后的基礎設施建設打下了堅實基礎。他評論：

“從零開始重建了整個堆棧，計算能力比 Maverick 低 10 倍，性能卻與之匹敵。這 9 個月的基礎設施建設工作構成了制勝的護城河。”

還有網友將 meta 的新模型與 Opus 4.5 進行了對比，認為“牛油果”表現遜色于 Opus 4.5。

值得注意的是，meta 此次發布的新模型走的是閉源路線，與此前一直主張的開源模型完全相反，這樣一些 x 用戶感到失望。

也有網友認為，meta 這次之所以將模型閉源，是因為此前的一系列開源沒有為股東創造足夠價值。

邁向“個人超級智能”，

仍有很長的路要走

盡管 meta 將 Muse Spark 定義為“個人超級智能”的起點，但其也明確承認，目前仍存在明顯短板。尤其是在兩個關鍵領域：

長時程智能體（long-horizon agents）

編碼與復雜工作流

這意味著，雖然模型已經具備多模態與推理能力，但在持續執行復雜任務、長鏈條決策等方面，仍未達到真正“代理人級別”的能力。

雖然 meta 利用生成式 AI 的進步以及自身在該技術領域的投資來增強其廣告業務并提高公司整體效率，但它尚未在大模型市場取得顯著突破，而其在該領域的主要競爭對手已經遙遙領先。

OpenAI 和 Anthropic 的估值總和現已超過 1 萬億美元，谷歌的 Gemini 技術和服務也獲得了廣泛認可，尤其是在消費市場。

據 Grand View Research 稱，全球生成式人工智能市場預計將以每年 40% 以上的速度增長，從 2025 年的約 220 億美元增長到 2033 年的近 3250 億美元，因此，該市場前景十分廣闊。

與此同時，meta 正在加大對人工智能基礎設施的投入，力圖趕上其他超大規模數據中心運營商。meta 在其最新財報中表示，其 2026 年與人工智能相關的資本支出將在 1150 億美元至 1350 億美元之間，幾乎是去年的兩倍。

meta 公司也在嘗試一種新的 AI 模型盈利模式，即通過 API 向第三方開發者提供 Muse Spark 底層技術的訪問權限。meta 公司表示，目前只有部分“特邀合作伙伴”可以訪問該 AI 模型的“私有 API 預覽版”，但計劃在未來某個時候向更廣泛的用戶群體提供付費 API 訪問權限。

meta 公司表示，其全新模型 Muse Spark 目前已應用于公司獨立的 meta AI 應用程序和桌面網站中的數字助理功能。該公司還表示，Muse Spark 將在未來幾周內率先登陸 Facebook、Instagram、WhatsApp 和 Messenger，以及公司與 Ray-Ban 合作推出的 meta AI 眼鏡。

meta 還計劃最終讓 Muse Spark 為 meta AI 應用程序中的 Vibes AI 視頻功能提供支持。meta 指出，該服務目前使用的是來自 Black Forest Labs 等第三方公司的 AI 模型。

meta 表示：“購物模式借鑒了我們應用程序中已有的造型靈感和品牌故事，展現了創作者和人們已經關注的社群的創意。”

更多>同類資訊

小米YU7 GT高性能SUV紐北賽道測試亮相，超強動力與賽道級配置引期待

04-09

阿里云百煉“記憶庫”上線：助力Agent跨會話記憶，多場景配置成本降半

04-09

硅谷華人團隊打造CREAO：讓AI Agent成為普通人觸手可及的生產力工具

04-09

三星顯示2026年下半年將為蘋果谷歌高端手機供應M16基材OLED面板

04-09

科技賦能希望：衷華腦機智能仿生手亮相，助力殘疾人“意念”操控生活

04-09

吉利銀河M7全球預售開啟：1.5L雷神電混+神盾電池，13.98萬起售續航達1730公里

04-09

特斯拉德州超級工廠現60輛Cybercab 配備方向盤或為測試早期車型

04-09

華為高管新動向：余承東與何剛雙雙入駐小紅書，開啟社交新篇章

04-09

紐北賽道現小米YU7 GT身影！高性能SUV配頂級動力與賽道級調校

04-09

Meta九個月磨一劍：Muse Spark多模態推理模型亮相，偏科但潛力足

04-09

Google深化Gemini與Gmail融合強調數據處理安全保障用戶隱私

04-09

Perplexity AI轉向AI智能體賽道收入躍升至4.5億美元展現新增長力

04-09

字節跳動Seeduplex全雙工語音大模型發布，豆包App全量上線開啟新交互

04-09

谷歌Gemini上線「Notebooks」功能：助力學習研究，打造個人知識管理新空間

04-09

李佳琦演講哽咽引關注深夜緊急澄清：缺席直播為兩個月非兩個季度

04-09

點擊查看更多 +

全站最新

大曝光！國家隊買入這些ETF

Meta殺回大模型主桌！扎克伯格打響AI翻身仗？

極光發布Modellix.ai：打通全球頂尖模型，重構下一代AI媒體生成

龍虎榜丨東山精密兩連板創新高，深股通凈買入2.92億元，一機構凈買入2.38億元

美股異動丨優信盤前漲5% 機構料其CY2025-2027E收入高增長

港股收評：恒科指大跌2%！黃金股承壓，鋁業股逆勢走高

熱門內容

本欄最新

推理經濟崛起：國產芯片迎新機遇，AI產業利潤分配格局重塑

SCRM深度賦能：解鎖電商私域流量高效管理新路徑與增長策略

京東開源JoyAI-Image-Edit圖像模型：攻克空間難題，賦能多元領域應用

B站上線播放頁暫停廣告：商業化嘗試再引熱議，理想現實如何平衡？

字節跳動Seeduplex全雙工語音模型上線，豆包通話實現邊聽邊講更自然

微億智造沖刺IPO：大廠撤離高管涉訴，光環背后隱憂待解

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

PearlError-包含視頻 過濾

PearlError-包含視頻過濾