滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

MiniMax稀宇科技M2.7大模型亮相，模型自我進(jìn)化開啟AI研發(fā)新篇章

時(shí)間：2026-03-19 04:57:47 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

MiniMax稀宇科技近日推出新一代Agent旗艦大模型M2.7，首次實(shí)現(xiàn)“模型自我進(jìn)化”功能。該模型通過(guò)構(gòu)建Agent Harness體系，深度參與自身訓(xùn)練與優(yōu)化流程，在部分研發(fā)場(chǎng)景中可承擔(dān)30%至50%的工作量，并在內(nèi)部評(píng)測(cè)中實(shí)現(xiàn)約30%的效果提升。這一突破標(biāo)志著AI模型從被動(dòng)接受訓(xùn)練轉(zhuǎn)向主動(dòng)優(yōu)化自身架構(gòu)的新階段。

在編程能力方面，M2.7展現(xiàn)強(qiáng)勁實(shí)力。在涵蓋多種編程語(yǔ)言的SWE-Pro測(cè)試中，該模型以56.22%的正確率追平GPT-5.3-Codex；在Repo級(jí)代碼生成基準(zhǔn)VIBE-Pro上，M2.7得分55.6%，幾乎與Opus 4.6持平。這些數(shù)據(jù)表明，M2.7不僅能處理單文件代碼生成，更能勝任完整項(xiàng)目交付任務(wù)。特別在復(fù)雜工程系統(tǒng)理解方面，該模型在Terminal Bench 2測(cè)試中取得57.0%的成績(jī)，證明其具備深入理解軟件運(yùn)行邏輯的能力。

研發(fā)團(tuán)隊(duì)通過(guò)構(gòu)建強(qiáng)化學(xué)習(xí)Harness，使M2.7具備自主優(yōu)化能力。在一個(gè)持續(xù)100輪的迭代實(shí)驗(yàn)中，模型通過(guò)“分析失敗軌跡→規(guī)劃改動(dòng)→修改代碼→運(yùn)行評(píng)測(cè)→對(duì)比結(jié)果→決定保留或回退”的循環(huán)，自主發(fā)現(xiàn)多項(xiàng)有效優(yōu)化方案。這些改進(jìn)包括系統(tǒng)性搜索采樣參數(shù)最優(yōu)組合、設(shè)計(jì)更具體的工作流指引，以及在Agent Loop中添加循環(huán)檢測(cè)機(jī)制。最終在內(nèi)部評(píng)測(cè)中，模型性能提升30%，顯著縮短研發(fā)周期。

辦公場(chǎng)景應(yīng)用中，M2.7在GDPval-AA評(píng)測(cè)中取得1495的ELO分?jǐn)?shù)，位列開源模型榜首。該模型對(duì)Office三件套的操作能力大幅提升，支持多輪高保真編輯和復(fù)雜模板應(yīng)用。在復(fù)雜環(huán)境交互測(cè)試中，M2.7在40個(gè)復(fù)雜技能（超過(guò)2000Token）的案例中保持97%的技能遵循率，在Toolathon評(píng)測(cè)中正確率達(dá)46.3%，達(dá)到全球第一梯隊(duì)水平。這些能力使其能高效處理金融研報(bào)分析、營(yíng)收模型構(gòu)建等復(fù)雜任務(wù)。

金融領(lǐng)域應(yīng)用案例顯示，M2.7可自主閱讀年報(bào)、業(yè)績(jī)溝通會(huì)紀(jì)要和多篇研報(bào)，交叉比對(duì)數(shù)據(jù)后獨(dú)立設(shè)計(jì)假設(shè)并構(gòu)建營(yíng)收預(yù)測(cè)模型。該模型還能根據(jù)模板生成PPT和研究報(bào)告，并在多輪交互中自我修正。從業(yè)者評(píng)價(jià)其產(chǎn)出物可直接進(jìn)入后續(xù)工作流程，顯著提升工作效率。在機(jī)器學(xué)習(xí)任務(wù)測(cè)試中，M2.7參與MLE Bench Lite的22個(gè)研發(fā)環(huán)節(jié)測(cè)試，三次測(cè)試平均得牌率達(dá)66.6%，與Gemini-3.1持平。

多智能體協(xié)作是M2.7的另一大亮點(diǎn)。Agent Teams功能要求模型具備穩(wěn)定的角色錨定、對(duì)抗性推理和協(xié)議遵循能力。在內(nèi)部產(chǎn)品原型開發(fā)測(cè)試中，由多個(gè)智能體組成的團(tuán)隊(duì)展現(xiàn)出高效協(xié)作能力，每個(gè)智能體都能主動(dòng)挑戰(zhàn)隊(duì)友的邏輯盲區(qū)，在復(fù)雜狀態(tài)機(jī)中自主決策。這種協(xié)作模式使項(xiàng)目開發(fā)效率提升數(shù)倍。

03-19

億緯鋰能“龍泉三號(hào)”“龍泉四號(hào)”下線助力成都新能源產(chǎn)業(yè)騰飛

記者了解到，去年，億緯鋰能固態(tài)電池研究院成都量產(chǎn)基地完成了10~60Ah全固態(tài)電池制造能力建設(shè)，并初步打通了固態(tài)電池生產(chǎn)制造工藝，發(fā)布了“龍泉二號(hào)”全固態(tài)電池，主要面向人形機(jī)器人、低空飛行器以及AI等高端裝…

03-19

理想2026新征程：增程穩(wěn)守基本盤，純電發(fā)力拓新局，技術(shù)賦能雙驅(qū)動(dòng)

03-19

金蝶2025年盈利開啟新程徐少春：借AI之勢(shì)2030年再造一個(gè)金蝶

03-19

黃仁勛GTC 2026發(fā)聲：AI提升效率促發(fā)展新就業(yè)機(jī)會(huì)持續(xù)涌現(xiàn)

03-19

黃仁勛：AI根本不會(huì)讓人失業(yè) 新工作會(huì)越來(lái)越多

03-19

全年82億營(yíng)收背后：BOSS直聘與求職者共筑信任，飛輪加速轉(zhuǎn)動(dòng)

03-19

光伏儲(chǔ)能與AI雙向奔赴：高紀(jì)凡談“算電協(xié)同”下的產(chǎn)業(yè)新機(jī)遇

03-19

遠(yuǎn)景AI賦能綠色氫氨：從技術(shù)突破到全球標(biāo)桿，開啟零碳貿(mào)易新時(shí)代

03-19

英偉達(dá)Feynman芯片引領(lǐng)“光進(jìn)銅退”潮流，A股CPO板塊多股漲停迎機(jī)遇

03-19

實(shí)測(cè)MiniMax M2.7：能寫代碼做游戲，還能化身家人趣聊天

03-19

王興興：人形機(jī)器人跑步將超人類，具身智能“GPT時(shí)刻”面臨泛化能力挑戰(zhàn)

03-19

守護(hù)真實(shí)與安全：今日頭條2025年度治理白皮書發(fā)布，多舉措凈化網(wǎng)絡(luò)生態(tài)

03-19

IBM收購(gòu)Confluent：攜手構(gòu)建智能數(shù)據(jù)基座，為企業(yè)AI與智能體注入實(shí)時(shí)動(dòng)力

03-19

華為哈勃入股魔芯科技，消費(fèi)級(jí)3D打印領(lǐng)域迎來(lái)新力量

03-19

點(diǎn)擊查看更多 +

全站最新

全球AI熱潮下成本攀升百度智能云、阿里云相繼宣布算力存儲(chǔ)價(jià)格上調(diào)

極氪8X預(yù)售火爆，技術(shù)破局引領(lǐng)吉利汽車高端市場(chǎng)新征程

奧迪Concept C純電跑車量產(chǎn)加速：明年投產(chǎn) 定位獨(dú)特性能可期

眾泰汽車深康車身復(fù)工啟新程完善配套體系但全面復(fù)產(chǎn)仍存挑戰(zhàn)

脫胎換骨！全新寶馬i3全球首發(fā)，800V高壓平臺(tái)續(xù)航破900km

特斯拉“夢(mèng)幻超跑”Roadster 4月下旬發(fā)布，極速400公里，飛行能力成焦點(diǎn)

熱門內(nèi)容

本欄最新

理想2026新征程：增程穩(wěn)守基本盤，純電發(fā)力拓新局，技術(shù)賦能雙驅(qū)動(dòng)

守護(hù)真實(shí)與安全：今日頭條2025年度治理白皮書發(fā)布，多舉措凈化網(wǎng)絡(luò)生態(tài)

AI時(shí)代新變革：Token“模元”成關(guān)鍵，數(shù)據(jù)中心轉(zhuǎn)型與定價(jià)體系新趨勢(shì)

企業(yè)AI新征程：修煉“內(nèi)功” 邁向“會(huì)執(zhí)行”的智能新境界

廣汽豐田鉑智3X上市周年獻(xiàn)禮：OTA升級(jí)智駕座艙安全全進(jìn)化

鉑智3X周年OTA升級(jí)：Momenta R6大模型賦能智駕新增六大AI智能體優(yōu)化體驗(yàn)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

MiniMax稀宇科技M2.7大模型亮相，模型自我進(jìn)化開啟AI研發(fā)新篇章