岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

Meta首個(gè)作品來了:Alexandr Wang 推出閉源模型

   時(shí)間:2026-04-09 18:59:12 來源:AI前線編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

作者|冬梅

Alexandr Wang 帶隊(duì),

meta 新模型深夜來襲

沉寂了 9 個(gè)月后,這位讓扎克伯克花了 143 億美元挖來的天才少年 Alexandr Wang 終于交出了首個(gè)作品。

昨夜,meta 正式發(fā)布新一代模型 Muse Spark,代號 Avocado,就是外界傳了很久的“牛油果”。這是其內(nèi)部 AI 組織 meta Superintelligence Labs 在戰(zhàn)略重組后的首個(gè)落地產(chǎn)品,也被視為這家科技巨頭邁向“個(gè)人超級智能”路線圖的起點(diǎn)。

Alexandr Wang 甚至激動地在 X 上連發(fā)九條推文介紹該模型。

與此前側(cè)重語言能力的模型不同,Muse Spark 從一開始就被定義為“原生多模態(tài)推理模型”。它不僅能夠處理文本,還能理解圖像、環(huán)境信息,并在此基礎(chǔ)上進(jìn)行推理、調(diào)用工具,甚至與其他智能體協(xié)同完成復(fù)雜任務(wù)。

這種能力組合,意味著 meta 正試圖將 AI 從“對話工具”升級為“行動系統(tǒng)”。

Muse Spark 的發(fā)布,并非一次單點(diǎn)技術(shù)升級,而更像是 meta AI 戰(zhàn)略的一次整體轉(zhuǎn)向。

過去一年,meta 在 AI 領(lǐng)域經(jīng)歷了明顯的路徑調(diào)整。從開源導(dǎo)向的 Llama 系列,到如今強(qiáng)調(diào)“超級智能”的閉環(huán)系統(tǒng)能力,核心變化在于:不再單純追求模型能力本身,而是強(qiáng)調(diào)“模型 + 工具 + 環(huán)境 + 多智能體”的系統(tǒng)級協(xié)同。

Muse Spark 正是這一思路的首個(gè)成型產(chǎn)品。

官方披露,為支撐這一方向,meta 正在對整個(gè)技術(shù)棧進(jìn)行重構(gòu),包括模型訓(xùn)練、數(shù)據(jù)管理以及底層基礎(chǔ)設(shè)施。其中,名為 Hyperion 的新一代數(shù)據(jù)中心被明確點(diǎn)名,成為未來大規(guī)模模型擴(kuò)展的關(guān)鍵支撐。

性能媲美 Gemini Pro 和 GPT 5.4

在能力層面,Muse Spark 的核心突破集中在“多模態(tài)推理”。

meta 在官方博客中表示:“在過去的九個(gè)月里,我們徹底重建了人工智能堆棧,速度比以往任何開發(fā)周期都要快。這個(gè)初始模型的設(shè)計(jì)初衷就是體積小、速度快,但卻足以應(yīng)對科學(xué)、數(shù)學(xué)和健康領(lǐng)域的復(fù)雜問題。這是一個(gè)強(qiáng)大的基礎(chǔ),下一代模型已經(jīng)在開發(fā)中。”

據(jù)介紹,meta 還發(fā)布了“思考模式”,該模式可協(xié)調(diào)多個(gè)智能體并行推理。這使得 Muse Spark 能夠與 Gemini Deep Think 和 GPT Pro 等前沿模型的極限推理模式相媲美。“思考模式”顯著提升了 Muse Spark 在挑戰(zhàn)性任務(wù)中的能力,在“人類最后的考試”任務(wù)中取得了 58% 的完成率,在“前沿科學(xué)研究”任務(wù)中取得了 38% 的完成率。

不同于傳統(tǒng)視覺模型僅能識別圖像內(nèi)容,Muse Spark 被設(shè)計(jì)為能夠?qū)⒁曈X信息與推理過程深度融合。例如,在 STEM 問題、物體識別與空間定位等場景中,它不僅能“看見”,還能“理解并推導(dǎo)”。

這種能力使其可以直接參與實(shí)際任務(wù)。例如:

通過攝像頭分析家電狀態(tài),并用動態(tài)標(biāo)注輔助用戶排查故障

根據(jù)視覺輸入生成互動內(nèi)容,如小游戲或教學(xué)演示

在復(fù)雜環(huán)境中進(jìn)行實(shí)時(shí)決策輔助

更關(guān)鍵的是,Muse Spark 支持“可視化思維鏈”(visual chain-of-thought),即將推理過程以可視形式呈現(xiàn)。這一設(shè)計(jì)不僅提升了可解釋性,也為復(fù)雜任務(wù)的人機(jī)協(xié)作提供了新的交互范式。

meta 此次特別強(qiáng)調(diào)了 Muse Spark 在健康領(lǐng)域的應(yīng)用潛力。

據(jù)介紹,meta 與超過 1000 名醫(yī)生合作構(gòu)建訓(xùn)練數(shù)據(jù),使模型在健康推理上具備更高的專業(yè)性與可靠性。基于這一能力,Muse Spark 可以生成帶交互界面的分析結(jié)果,例如:

食物營養(yǎng)結(jié)構(gòu)的可視化拆解

運(yùn)動過程中肌肉激活情況的動態(tài)展示

個(gè)性化飲食建議(結(jié)合用戶健康狀況)

這類能力的本質(zhì),是將 AI 從“信息提供者”升級為“決策輔助系統(tǒng)”。

在技術(shù)層面,meta 把另一個(gè)重點(diǎn)放在“擴(kuò)展效率”上。

官方披露,在過去九個(gè)月中,團(tuán)隊(duì)重構(gòu)了預(yù)訓(xùn)練體系,包括模型架構(gòu)、優(yōu)化方法和數(shù)據(jù)管理流程。結(jié)果是:在達(dá)到相同性能的前提下,Muse Spark 所需的訓(xùn)練計(jì)算量(FLOPs)相比上一代模型(如 Llama 4 Maverick)下降了一個(gè)數(shù)量級以上。

這一結(jié)果具有明確的行業(yè)意義。

過去兩年,大模型競爭很大程度上依賴“堆算力”。而 meta 此次強(qiáng)調(diào)的,是通過工程優(yōu)化提升“單位算力產(chǎn)出”。換句話說,其試圖證明:性 能增長不必完全依賴指數(shù)級資源投入。

提示:你能把它轉(zhuǎn)換成一個(gè)我可以在網(wǎng)上玩的數(shù)獨(dú)游戲嗎?

技術(shù)實(shí)現(xiàn)細(xì)節(jié)完整披露

在官方技術(shù)博客中,meta 詳細(xì)介紹了他們?nèi)绾螐娜齻€(gè)維度研究和追蹤 Muse Spark 的擴(kuò)展特性:預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)和測試時(shí)推理。

預(yù)訓(xùn)練。在預(yù)訓(xùn)練階段,Muse Spark 獲得其核心的多模態(tài)理解、推理和編碼能力——這是強(qiáng)化學(xué)習(xí)和測試時(shí)計(jì)算的基礎(chǔ)。

meta 重構(gòu)了預(yù)訓(xùn)練堆棧,改進(jìn)了模型架構(gòu)、優(yōu)化和數(shù)據(jù)管理。這些改進(jìn)共同提升了其利用每一單位計(jì)算資源所能達(dá)到的性能。為了嚴(yán)格評估新方案,meta 研發(fā)團(tuán)隊(duì)對一系列小型模型擬合了一個(gè)擴(kuò)展定律,并比較了達(dá)到特定性能水平所需的訓(xùn)練浮點(diǎn)運(yùn)算次數(shù)(FLOPs)。結(jié)果顯而易見:與之前的模型 Llama 4 Maverick 相比,他們用少一個(gè)數(shù)量級以上的計(jì)算資源就能達(dá)到相同的性能。這一改進(jìn)也使得 Muse Spark 比目前可供比較的領(lǐng)先基礎(chǔ)模型效率更高。

強(qiáng)化學(xué)習(xí)。經(jīng)過預(yù)訓(xùn)練后,強(qiáng)化學(xué)習(xí) (RL) 利用計(jì)算能力可擴(kuò)展地提升模型性能。盡管大規(guī)模強(qiáng)化學(xué)習(xí)歷來容易出現(xiàn)不穩(wěn)定,但 meta 的新技術(shù)棧能夠帶來平穩(wěn)、可預(yù)測的性能提升。

下圖展示了擴(kuò)展 Muse Spark 的強(qiáng)化學(xué)習(xí) (RL) 計(jì)算能力(以步數(shù)衡量)所帶來的益處。左圖顯示,在訓(xùn)練數(shù)據(jù)上,pass@1 和 pass@16(16 次嘗試中至少成功一次)的數(shù)值呈對數(shù)線性增長。這表明強(qiáng)化學(xué)習(xí)在不影響推理多樣性的前提下提高了模型的可靠性。右圖顯示,在預(yù)留的評估集上準(zhǔn)確率的增長表明,強(qiáng)化學(xué)習(xí)帶來的收益具有可預(yù)測的泛化能力:Muse Spark 在訓(xùn)練中未遇到的任務(wù)上也表現(xiàn)良好。

測試時(shí)推理。強(qiáng)化學(xué)習(xí)訓(xùn)練模型在回答問題前進(jìn)行“思考”——這一過程被稱為測試時(shí)推理。要讓數(shù)十億用戶擁有這種能力,就需要高效利用推理令牌。為此,研發(fā)團(tuán)隊(duì)依靠兩個(gè)關(guān)鍵手段:一是思考時(shí)間懲罰,用于優(yōu)化 token 使用;二是多智能體編排,用于在不降低響應(yīng)速度的前提下提升性能。

為了在每個(gè) token 上實(shí)現(xiàn)最高的智能水平,強(qiáng)化學(xué)習(xí)訓(xùn)練在增加思考時(shí)間的前提下,最大化正確率。在諸如 AIME 等部分評估任務(wù)中,這會導(dǎo)致階段性轉(zhuǎn)變。在初始階段,模型通過延長思考時(shí)間來提升性能;之后,思考時(shí)間的懲罰會促使模型進(jìn)行思維壓縮——Muse Spark 會壓縮其推理過程,從而使用更少的 token 解決問題。壓縮之后,模型會再次擴(kuò)展其解決方案,以獲得更強(qiáng)的性能。

為了在不顯著增加延遲的情況下,將更多時(shí)間用于測試時(shí)的推理,可以擴(kuò)展協(xié)作解決難題的并行智能體的數(shù)量。下圖展示了這種方法的優(yōu)勢。標(biāo)準(zhǔn)的測試時(shí)擴(kuò)展方法會使單個(gè)智能體思考更長時(shí)間,而采用多智能體思維的 Muse Spark 擴(kuò)展方法則可以在保持相當(dāng)延遲的情況下實(shí)現(xiàn)更高的性能。

在安全層面,meta 表示已在部署前對 Muse Spark 進(jìn)行系統(tǒng)性評估,依據(jù)其更新后的“高級人工智能擴(kuò)展框架”(Advanced AI Scaling framework),對威脅模型、評估流程及上線標(biāo)準(zhǔn)進(jìn)行了統(tǒng)一規(guī)范。

評估重點(diǎn)覆蓋前沿風(fēng)險(xiǎn)(如生物與化學(xué)領(lǐng)域)、行為一致性以及對抗魯棒性,并在安全措施實(shí)施前后進(jìn)行對比測試。結(jié)果顯示,Muse Spark 在涉及高風(fēng)險(xiǎn)內(nèi)容時(shí)表現(xiàn)出明顯的拒絕傾向,這主要得益于數(shù)據(jù)過濾、后訓(xùn)練安全對齊及系統(tǒng)級防護(hù)的多層機(jī)制。

meta 同時(shí)指出,在網(wǎng)絡(luò)攻擊或“失控”場景中,當(dāng)前模型尚不具備執(zhí)行復(fù)雜威脅任務(wù)的自主能力。整體來看,Muse Spark 在已評估的風(fēng)險(xiǎn)范圍內(nèi)處于可控水平,更多細(xì)節(jié)將于后續(xù)《安全與準(zhǔn)備報(bào)告》中披露。

網(wǎng)友:模型強(qiáng)不強(qiáng)不知道,

但閉源讓人失望

Muse Spark 的發(fā)布在技術(shù)社區(qū)引發(fā)了巨大反響 ,Stability AI 創(chuàng)始人 Emad Mostaque 及 meta 前首席科學(xué)家 Yann LeCun、Coinbase 聯(lián)創(chuàng)兼 CEO Brian Armstrong 等大佬紛紛在 x 上向 Alexandr Wang 和 meta 表示祝賀。

另一方面,普通網(wǎng)友和部分開發(fā)者則聚焦于實(shí)際應(yīng)用層面相關(guān)問題展開了爭論。

有網(wǎng)友表示,該模型在排行榜上的表現(xiàn)令人印象深刻,但好奇 meta 是否也會在智能體編碼領(lǐng)域展開競爭?

還有網(wǎng)友表示,新模型的多代理編排部分很有意思,Muse Spark 能原生處理這個(gè)問題,是一個(gè)真正的突破。他寫道:“我一直在單體倉庫的不同模塊上運(yùn)行并行的 Claude Code 代理,協(xié)調(diào)開銷非常大。如果 Muse Spark 能原生處理這個(gè)問題,對于大型代碼庫的復(fù)雜重構(gòu)來說,這將是一個(gè)真正的突破。”

有網(wǎng)友認(rèn)為,meta 能在短時(shí)間內(nèi)構(gòu)建出性能如此強(qiáng)大的模型,為以后的基礎(chǔ)設(shè)施建設(shè)打下了堅(jiān)實(shí)基礎(chǔ)。他評論:

“從零開始重建了整個(gè)堆棧,計(jì)算能力比 Maverick 低 10 倍,性能卻與之匹敵。這 9 個(gè)月的基礎(chǔ)設(shè)施建設(shè)工作構(gòu)成了制勝的護(hù)城河。”

還有網(wǎng)友將 meta 的新模型與 Opus 4.5 進(jìn)行了對比,認(rèn)為“牛油果”表現(xiàn)遜色于 Opus 4.5。

值得注意的是,meta 此次發(fā)布的新模型走的是閉源路線,與此前一直主張的開源模型完全相反,這樣一些 x 用戶感到失望。

也有網(wǎng)友認(rèn)為,meta 這次之所以將模型閉源,是因?yàn)榇饲暗囊幌盗虚_源沒有為股東創(chuàng)造足夠價(jià)值。

邁向“個(gè)人超級智能”,

仍有很長的路要走

盡管 meta 將 Muse Spark 定義為“個(gè)人超級智能”的起點(diǎn),但其也明確承認(rèn),目前仍存在明顯短板。尤其是在兩個(gè)關(guān)鍵領(lǐng)域:

長時(shí)程智能體(long-horizon agents)

編碼與復(fù)雜工作流

這意味著,雖然模型已經(jīng)具備多模態(tài)與推理能力,但在持續(xù)執(zhí)行復(fù)雜任務(wù)、長鏈條決策等方面,仍未達(dá)到真正“代理人級別”的能力。

雖然 meta 利用生成式 AI 的進(jìn)步以及自身在該技術(shù)領(lǐng)域的投資來增強(qiáng)其廣告業(yè)務(wù)并提高公司整體效率,但它尚未在大模型市場取得顯著突破,而其在該領(lǐng)域的主要競爭對手已經(jīng)遙遙領(lǐng)先。

OpenAI 和 Anthropic 的估值總和現(xiàn)已超過 1 萬億美元,谷歌的 Gemini 技術(shù)和服務(wù)也獲得了廣泛認(rèn)可,尤其是在消費(fèi)市場。

據(jù) Grand View Research 稱,全球生成式人工智能市場預(yù)計(jì)將以每年 40% 以上的速度增長,從 2025 年的約 220 億美元增長到 2033 年的近 3250 億美元,因此,該市場前景十分廣闊。

與此同時(shí),meta 正在加大對人工智能基礎(chǔ)設(shè)施的投入,力圖趕上其他超大規(guī)模數(shù)據(jù)中心運(yùn)營商。meta 在其最新財(cái)報(bào)中表示,其 2026 年與人工智能相關(guān)的資本支出將在 1150 億美元至 1350 億美元之間,幾乎是去年的兩倍。

meta 公司也在嘗試一種新的 AI 模型盈利模式,即通過 API 向第三方開發(fā)者提供 Muse Spark 底層技術(shù)的訪問權(quán)限。meta 公司表示,目前只有部分“特邀合作伙伴”可以訪問該 AI 模型的“私有 API 預(yù)覽版”,但計(jì)劃在未來某個(gè)時(shí)候向更廣泛的用戶群體提供付費(fèi) API 訪問權(quán)限。

meta 公司表示,其全新模型 Muse Spark 目前已應(yīng)用于公司獨(dú)立的 meta AI 應(yīng)用程序和桌面網(wǎng)站中的數(shù)字助理功能。該公司還表示,Muse Spark 將在未來幾周內(nèi)率先登陸 Facebook、Instagram、WhatsApp 和 Messenger,以及公司與 Ray-Ban 合作推出的 meta AI 眼鏡。

meta 還計(jì)劃最終讓 Muse Spark 為 meta AI 應(yīng)用程序中的 Vibes AI 視頻功能提供支持。meta 指出,該服務(wù)目前使用的是來自 Black Forest Labs 等第三方公司的 AI 模型。

meta 表示:“購物模式借鑒了我們應(yīng)用程序中已有的造型靈感和品牌故事,展現(xiàn)了創(chuàng)作者和人們已經(jīng)關(guān)注的社群的創(chuàng)意。”

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 香蕉a视频 | 日韩在线不卡 | 午夜免费时刻 | 日韩中文字幕在线播放 | 佐佐木明希av | 午夜高清福利 | 香蕉视频在线免费看 | 91久久久久久久久久久 | 国产激情毛片 | av资源免费 | 92久久 | 国产又黄又爽又色 | 国产精品久久久久久在线观看 | 中文一二三区 | 成人免费精品 | 美丽姑娘在线观看免费 | 极品探花在线观看 | 久草a在线 | 日本另类| 91色中文| 少妇毛片一区二区三区 | 在线亚洲色图 | 黄色大片91 | 亚洲精品99| 欧美一级做性受免费大片免费 | www.jizzjizz.com | 九九视频免费 | 毛片天堂 | 国内精品视频在线 | 日韩一区二区中文字幕 | 国产区在线观看 | 国产黄色一级大片 | 欧美激情在线观看视频 | 国产超碰在线观看 | 成人黄色一级视频 | 久久6精品 | 日本黄色片免费看 | 日本高清www免费视频 | 成人午夜大片 | 精品视频久久久久久久 | 91精品国产综合久久福利 |