岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

PearlError-包含視頻 過濾

   時間:2026-04-09 18:09:12 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

作者|冬梅

Alexandr Wang 帶隊,

meta 新模型深夜來襲

沉寂了 9 個月后,這位讓扎克伯克花了 143 億美元挖來的天才少年 Alexandr Wang 終于交出了首個作品。

昨夜,meta 正式發布新一代模型 Muse Spark,代號 Avocado,就是外界傳了很久的“牛油果”。這是其內部 AI 組織 meta Superintelligence Labs 在戰略重組后的首個落地產品,也被視為這家科技巨頭邁向“個人超級智能”路線圖的起點。

Alexandr Wang 甚至激動地在 X 上連發九條推文介紹該模型。

與此前側重語言能力的模型不同,Muse Spark 從一開始就被定義為“原生多模態推理模型”。它不僅能夠處理文本,還能理解圖像、環境信息,并在此基礎上進行推理、調用工具,甚至與其他智能體協同完成復雜任務。

這種能力組合,意味著 meta 正試圖將 AI 從“對話工具”升級為“行動系統”。

Muse Spark 的發布,并非一次單點技術升級,而更像是 meta AI 戰略的一次整體轉向。

過去一年,meta 在 AI 領域經歷了明顯的路徑調整。從開源導向的 Llama 系列,到如今強調“超級智能”的閉環系統能力,核心變化在于:不再單純追求模型能力本身,而是強調“模型 + 工具 + 環境 + 多智能體”的系統級協同。

Muse Spark 正是這一思路的首個成型產品。

官方披露,為支撐這一方向,meta 正在對整個技術棧進行重構,包括模型訓練、數據管理以及底層基礎設施。其中,名為 Hyperion 的新一代數據中心被明確點名,成為未來大規模模型擴展的關鍵支撐。

性能媲美 Gemini Pro 和 GPT 5.4

在能力層面,Muse Spark 的核心突破集中在“多模態推理”。

meta 在官方博客中表示:“在過去的九個月里,我們徹底重建了人工智能堆棧,速度比以往任何開發周期都要快。這個初始模型的設計初衷就是體積小、速度快,但卻足以應對科學、數學和健康領域的復雜問題。這是一個強大的基礎,下一代模型已經在開發中。”

據介紹,meta 還發布了“思考模式”,該模式可協調多個智能體并行推理。這使得 Muse Spark 能夠與 Gemini Deep Think 和 GPT Pro 等前沿模型的極限推理模式相媲美。“思考模式”顯著提升了 Muse Spark 在挑戰性任務中的能力,在“人類最后的考試”任務中取得了 58% 的完成率,在“前沿科學研究”任務中取得了 38% 的完成率。

不同于傳統視覺模型僅能識別圖像內容,Muse Spark 被設計為能夠將視覺信息與推理過程深度融合。例如,在 STEM 問題、物體識別與空間定位等場景中,它不僅能“看見”,還能“理解并推導”。

這種能力使其可以直接參與實際任務。例如:

通過攝像頭分析家電狀態,并用動態標注輔助用戶排查故障

根據視覺輸入生成互動內容,如小游戲或教學演示

在復雜環境中進行實時決策輔助

更關鍵的是,Muse Spark 支持“可視化思維鏈”(visual chain-of-thought),即將推理過程以可視形式呈現。這一設計不僅提升了可解釋性,也為復雜任務的人機協作提供了新的交互范式。

meta 此次特別強調了 Muse Spark 在健康領域的應用潛力。

據介紹,meta 與超過 1000 名醫生合作構建訓練數據,使模型在健康推理上具備更高的專業性與可靠性。基于這一能力,Muse Spark 可以生成帶交互界面的分析結果,例如:

食物營養結構的可視化拆解

運動過程中肌肉激活情況的動態展示

個性化飲食建議(結合用戶健康狀況)

這類能力的本質,是將 AI 從“信息提供者”升級為“決策輔助系統”。

在技術層面,meta 把另一個重點放在“擴展效率”上。

官方披露,在過去九個月中,團隊重構了預訓練體系,包括模型架構、優化方法和數據管理流程。結果是:在達到相同性能的前提下,Muse Spark 所需的訓練計算量(FLOPs)相比上一代模型(如 Llama 4 Maverick)下降了一個數量級以上。

這一結果具有明確的行業意義。

過去兩年,大模型競爭很大程度上依賴“堆算力”。而 meta 此次強調的,是通過工程優化提升“單位算力產出”。換句話說,其試圖證明:性 能增長不必完全依賴指數級資源投入。

提示:你能把它轉換成一個我可以在網上玩的數獨游戲嗎?

技術實現細節完整披露

在官方技術博客中,meta 詳細介紹了他們如何從三個維度研究和追蹤 Muse Spark 的擴展特性:預訓練、強化學習和測試時推理。

預訓練。在預訓練階段,Muse Spark 獲得其核心的多模態理解、推理和編碼能力——這是強化學習和測試時計算的基礎。

meta 重構了預訓練堆棧,改進了模型架構、優化和數據管理。這些改進共同提升了其利用每一單位計算資源所能達到的性能。為了嚴格評估新方案,meta 研發團隊對一系列小型模型擬合了一個擴展定律,并比較了達到特定性能水平所需的訓練浮點運算次數(FLOPs)。結果顯而易見:與之前的模型 Llama 4 Maverick 相比,他們用少一個數量級以上的計算資源就能達到相同的性能。這一改進也使得 Muse Spark 比目前可供比較的領先基礎模型效率更高。

強化學習。經過預訓練后,強化學習 (RL) 利用計算能力可擴展地提升模型性能。盡管大規模強化學習歷來容易出現不穩定,但 meta 的新技術棧能夠帶來平穩、可預測的性能提升。

下圖展示了擴展 Muse Spark 的強化學習 (RL) 計算能力(以步數衡量)所帶來的益處。左圖顯示,在訓練數據上,pass@1 和 pass@16(16 次嘗試中至少成功一次)的數值呈對數線性增長。這表明強化學習在不影響推理多樣性的前提下提高了模型的可靠性。右圖顯示,在預留的評估集上準確率的增長表明,強化學習帶來的收益具有可預測的泛化能力:Muse Spark 在訓練中未遇到的任務上也表現良好。

測試時推理。強化學習訓練模型在回答問題前進行“思考”——這一過程被稱為測試時推理。要讓數十億用戶擁有這種能力,就需要高效利用推理令牌。為此,研發團隊依靠兩個關鍵手段:一是思考時間懲罰,用于優化 token 使用;二是多智能體編排,用于在不降低響應速度的前提下提升性能。

為了在每個 token 上實現最高的智能水平,強化學習訓練在增加思考時間的前提下,最大化正確率。在諸如 AIME 等部分評估任務中,這會導致階段性轉變。在初始階段,模型通過延長思考時間來提升性能;之后,思考時間的懲罰會促使模型進行思維壓縮——Muse Spark 會壓縮其推理過程,從而使用更少的 token 解決問題。壓縮之后,模型會再次擴展其解決方案,以獲得更強的性能。

為了在不顯著增加延遲的情況下,將更多時間用于測試時的推理,可以擴展協作解決難題的并行智能體的數量。下圖展示了這種方法的優勢。標準的測試時擴展方法會使單個智能體思考更長時間,而采用多智能體思維的 Muse Spark 擴展方法則可以在保持相當延遲的情況下實現更高的性能。

在安全層面,meta 表示已在部署前對 Muse Spark 進行系統性評估,依據其更新后的“高級人工智能擴展框架”(Advanced AI Scaling framework),對威脅模型、評估流程及上線標準進行了統一規范。

評估重點覆蓋前沿風險(如生物與化學領域)、行為一致性以及對抗魯棒性,并在安全措施實施前后進行對比測試。結果顯示,Muse Spark 在涉及高風險內容時表現出明顯的拒絕傾向,這主要得益于數據過濾、后訓練安全對齊及系統級防護的多層機制。

meta 同時指出,在網絡攻擊或“失控”場景中,當前模型尚不具備執行復雜威脅任務的自主能力。整體來看,Muse Spark 在已評估的風險范圍內處于可控水平,更多細節將于后續《安全與準備報告》中披露。

網友:模型強不強不知道,

但閉源讓人失望

Muse Spark 的發布在技術社區引發了巨大反響 ,Stability AI 創始人 Emad Mostaque 及 meta 前首席科學家 Yann LeCun、Coinbase 聯創兼 CEO Brian Armstrong 等大佬紛紛在 x 上向 Alexandr Wang 和 meta 表示祝賀。

另一方面,普通網友和部分開發者則聚焦于實際應用層面相關問題展開了爭論。

有網友表示,該模型在排行榜上的表現令人印象深刻,但好奇 meta 是否也會在智能體編碼領域展開競爭?

還有網友表示,新模型的多代理編排部分很有意思,Muse Spark 能原生處理這個問題,是一個真正的突破。他寫道:“我一直在單體倉庫的不同模塊上運行并行的 Claude Code 代理,協調開銷非常大。如果 Muse Spark 能原生處理這個問題,對于大型代碼庫的復雜重構來說,這將是一個真正的突破。”

有網友認為,meta 能在短時間內構建出性能如此強大的模型,為以后的基礎設施建設打下了堅實基礎。他評論:

“從零開始重建了整個堆棧,計算能力比 Maverick 低 10 倍,性能卻與之匹敵。這 9 個月的基礎設施建設工作構成了制勝的護城河。”

還有網友將 meta 的新模型與 Opus 4.5 進行了對比,認為“牛油果”表現遜色于 Opus 4.5。

值得注意的是,meta 此次發布的新模型走的是閉源路線,與此前一直主張的開源模型完全相反,這樣一些 x 用戶感到失望。

也有網友認為,meta 這次之所以將模型閉源,是因為此前的一系列開源沒有為股東創造足夠價值。

邁向“個人超級智能”,

仍有很長的路要走

盡管 meta 將 Muse Spark 定義為“個人超級智能”的起點,但其也明確承認,目前仍存在明顯短板。尤其是在兩個關鍵領域:

長時程智能體(long-horizon agents)

編碼與復雜工作流

這意味著,雖然模型已經具備多模態與推理能力,但在持續執行復雜任務、長鏈條決策等方面,仍未達到真正“代理人級別”的能力。

雖然 meta 利用生成式 AI 的進步以及自身在該技術領域的投資來增強其廣告業務并提高公司整體效率,但它尚未在大模型市場取得顯著突破,而其在該領域的主要競爭對手已經遙遙領先。

OpenAI 和 Anthropic 的估值總和現已超過 1 萬億美元,谷歌的 Gemini 技術和服務也獲得了廣泛認可,尤其是在消費市場。

據 Grand View Research 稱,全球生成式人工智能市場預計將以每年 40% 以上的速度增長,從 2025 年的約 220 億美元增長到 2033 年的近 3250 億美元,因此,該市場前景十分廣闊。

與此同時,meta 正在加大對人工智能基礎設施的投入,力圖趕上其他超大規模數據中心運營商。meta 在其最新財報中表示,其 2026 年與人工智能相關的資本支出將在 1150 億美元至 1350 億美元之間,幾乎是去年的兩倍。

meta 公司也在嘗試一種新的 AI 模型盈利模式,即通過 API 向第三方開發者提供 Muse Spark 底層技術的訪問權限。meta 公司表示,目前只有部分“特邀合作伙伴”可以訪問該 AI 模型的“私有 API 預覽版”,但計劃在未來某個時候向更廣泛的用戶群體提供付費 API 訪問權限。

meta 公司表示,其全新模型 Muse Spark 目前已應用于公司獨立的 meta AI 應用程序和桌面網站中的數字助理功能。該公司還表示,Muse Spark 將在未來幾周內率先登陸 Facebook、Instagram、WhatsApp 和 Messenger,以及公司與 Ray-Ban 合作推出的 meta AI 眼鏡。

meta 還計劃最終讓 Muse Spark 為 meta AI 應用程序中的 Vibes AI 視頻功能提供支持。meta 指出,該服務目前使用的是來自 Black Forest Labs 等第三方公司的 AI 模型。

meta 表示:“購物模式借鑒了我們應用程序中已有的造型靈感和品牌故事,展現了創作者和人們已經關注的社群的創意。”

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 黄色91网站| 91在线精品李宗瑞 | 青青激情视频 | 久草视频在线看 | 九热精品 | 国产精品久久综合 | 欧美日一区二区 | 向井蓝在线观看 | 超碰免费观看 | 欧美日韩一区二区区别是什么 | 精品综合网| 成人激情视频网 | 欧美一级大片在线观看 | 1024国产视频 | 影音先锋国产在线 | 久久一次 | 中文字幕第一页亚洲 | 福利在线免费观看 | 又色又爽视频 | 6080av| 欧美 唯美 清纯 偷拍 | 亚洲欧美日本在线观看 | 毛片xxx | 侵犯稚嫩小箩莉h文系列小说 | jizz国产精品 | 一区二区免费 | www 在线观看视频 | 日本五十路在线 | 婷婷色中文字幕 | 成人三级视频 | 成人永久免费视频 | 国产福利精品在线 | 黄色免费网 | 免费观看黄色录像 | 精品美女久久 | 国产成人精品一区二区三区视频 | 93久久精品日日躁夜夜躁欧美 | 天堂综合网久久 | www亚洲 | 国产精品久久久久久久成人午夜 | 国产激情网|