滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

螞蟻開源新一代全模態(tài)大模型Ming-Flash-Omni 2.0

時(shí)間：2026-02-11 19:52:05 來源：快科技編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

2月11日消息今日，螞蟻集團(tuán)開源發(fā)布全模態(tài)大模型 Ming-Flash-Omni 2.0。

在多項(xiàng)公開基準(zhǔn)測(cè)試中，該模型在視覺語(yǔ)言理解、語(yǔ)音可控生成、圖像生成與編輯等關(guān)鍵能力表現(xiàn)突出，部分指標(biāo)超越 Gemini 2.5 Pro，成為開源全模態(tài)大模型性能新標(biāo)桿。

Ming-Flash-Omni 2.0 也是業(yè)界首個(gè)全場(chǎng)景音頻統(tǒng)一生成模型，可在同一條音軌中同時(shí)生成語(yǔ)音、環(huán)境音效與音樂。

用戶只需用自然語(yǔ)言下指令，即可對(duì)音色、語(yǔ)速、語(yǔ)調(diào)、音量、情緒與方言等進(jìn)行精細(xì)控制。

模型在推理階段實(shí)現(xiàn)了 3.1Hz 的極低推理幀率，實(shí)現(xiàn)了分鐘級(jí)長(zhǎng)音頻的實(shí)時(shí)高保真生成，在推理效率與成本控制上保持業(yè)界領(lǐng)先。

螞蟻集團(tuán)在全模態(tài)方向已持續(xù)投入多年，Ming-Omni 系列迭代三個(gè)版本，此次將 Ming-Flash-Omni 2.0 開源，意味著其核心能力以“可復(fù)用底座”的形式對(duì)外釋放，為端到端多模態(tài)應(yīng)用開發(fā)提供統(tǒng)一能力入口。

據(jù)了解，Ming-Flash-Omni 2.0基于 Ling-2.0 架構(gòu)（MoE，100B-A6B）訓(xùn)練，圍繞“看得更準(zhǔn)、聽得更細(xì)、生成更穩(wěn)”三大目標(biāo)全面優(yōu)化。

視覺方面，融合億級(jí)細(xì)粒度數(shù)據(jù)與難例訓(xùn)練策略，顯著提升對(duì)近緣動(dòng)植物、工藝細(xì)節(jié)和稀有文物等復(fù)雜對(duì)象的識(shí)別能力；

音頻方面，實(shí)現(xiàn)語(yǔ)音、音效、音樂同軌生成，支持自然語(yǔ)言精細(xì)控制音色、語(yǔ)速、情緒等參數(shù)，并具備零樣本音色克隆與定制能力；

圖像方面，增強(qiáng)復(fù)雜編輯的穩(wěn)定性，支持光影調(diào)整、場(chǎng)景替換、人物姿態(tài)優(yōu)化及一鍵修圖等功能，在動(dòng)態(tài)場(chǎng)景中仍保持畫面連貫與細(xì)節(jié)真實(shí)。

目前，Ming-Flash-Omni 2.0 的模型權(quán)重、推理代碼已在 Hugging Face 等開源社區(qū)發(fā)布。用戶也可通過螞蟻百靈官方平臺(tái) Ling Studio 在線體驗(yàn)與調(diào)用。

更多>同類資訊

阿維塔AVATR.OS 5.0.0版本推送：MoLA大模型助手上線

02-11

千問DAU達(dá)到7352萬(wàn)，逼平豆包

02-11

電商AI客服擅自承諾顧客巨額折扣：商家面臨法律糾紛

02-11

DeepSeek突然測(cè)試新模型，上下文已到百萬(wàn)級(jí)

02-11

螞蟻集團(tuán)開源 Ming-Flash-Omni 2.0

02-11

螞蟻集團(tuán)開源 Ming-flash-omni 2.0

02-11

Runway完成3.15億美元E輪融資，估值飆升至53億美元，推動(dòng)下一代AI世界模型

02-11

螞蟻集團(tuán)開源全模態(tài)大模型Ming-flash-omni 2.0 性能對(duì)標(biāo)Gemini 2.5 Pro

02-11

臺(tái)積電將向員工發(fā)放450億元高額獎(jiǎng)金人均超過50萬(wàn)

02-11

2025年小微企業(yè)筑基、新興賽道發(fā)力、文旅升溫天眼查數(shù)據(jù)解碼經(jīng)濟(jì)活力

02-11

瓜子二手車創(chuàng)始人楊浩涌：從互聯(lián)網(wǎng)“老將”到投資高手，斬獲超2億回報(bào)

02-11

眾擎啟動(dòng)全球首個(gè)人形機(jī)器人格斗聯(lián)賽，以賽促研加速技術(shù)落地與人才孵化

02-11

具身智能“ChatGPT時(shí)刻”何時(shí)來？產(chǎn)業(yè)長(zhǎng)跑考驗(yàn)系統(tǒng)耐力

02-11

偉創(chuàng)電氣：以工控為基，憑一體化優(yōu)勢(shì)領(lǐng)跑機(jī)器人核心零部件賽道

02-11

2001年生“00后”吳東波：教機(jī)器人“學(xué)做人” 助力柳州“智造”升級(jí)

工業(yè)機(jī)器人學(xué)會(huì)一個(gè)簡(jiǎn)單動(dòng)作，至少需要重復(fù)300次，機(jī)器人訓(xùn)練師的目標(biāo)就是讓這些機(jī)器人將來能夠替代人工去做重復(fù)性、危險(xiǎn)性比較高的工作。目前，廣西柳州市已培育人工智能終端及機(jī)器人規(guī)上企業(yè)48家，2025年該產(chǎn)業(yè)…

02-11

點(diǎn)擊查看更多 +

全站最新

48小時(shí)！xAI連失兩根“頂梁柱”

別只盯著AI，這個(gè)賽道即將加速

微軟探索高溫超導(dǎo)重構(gòu)數(shù)據(jù)中心供電直指AI算力“電力瓶頸”

麥格理：首予文遠(yuǎn)知行"跑贏大市"評(píng)級(jí)，目標(biāo)價(jià)46港元/17.5美元

港股異動(dòng)丨裕元集團(tuán)跌超9%，1月經(jīng)營(yíng)收益同比跌12.5%

中國(guó)飛鶴春節(jié)獻(xiàn)映《東北真行》新篇章講述匠心與守護(hù)的時(shí)代故事

熱門內(nèi)容

本欄最新

長(zhǎng)城魏牌V9X來襲！近5米3大身軀，2.0T插混續(xù)航超千公里，實(shí)力幾何？

央視聚焦東風(fēng)汽車：以創(chuàng)新智造引領(lǐng)，驅(qū)動(dòng)中國(guó)汽車產(chǎn)業(yè)穩(wěn)健邁向新征程

閔行新春沙龍：網(wǎng)絡(luò)創(chuàng)作者共探優(yōu)質(zhì)內(nèi)容創(chuàng)作，共繪閔行發(fā)展新畫卷

理想汽車新突破：全新L9馬赫100雙芯片有效算力遠(yuǎn)超英偉達(dá)Thor U

問界星光之夜余承東解讀品牌命名，大模型AI將升級(jí)老車主，銷量目標(biāo)再?zèng)_刺

長(zhǎng)城補(bǔ)齊產(chǎn)品短板！魏牌V9X官圖曝光，攜新技術(shù)入局綠牌全尺寸SUV賽道

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻開源新一代全模態(tài)大模型Ming-Flash-Omni 2.0