岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

螞蟻集團開源全模態大模型Ming-flash-omni 2.0 性能對標Gemini 2.5 Pro

   時間:2026-02-11 19:22:46 來源:TechWeb編輯:快訊 IP:北京 發表評論無障礙通道
 

2月11日消息,螞蟻集團開源發布全模態大模型Ming-flash-omni 2.0。在多項公開基準測試中,該模型在視覺語言理解、語音可控生成、圖像生成與編輯等關鍵能力表現突出。

據介紹,Ming-flash-omni 2.0是業界首個全場景音頻統一生成模型,可在同一條音軌中同時生成語音、環境音效與音樂。用戶只需用自然語言下指令,即可對音色、語速、語調、音量、情緒與方言等進行精細控制。模型在推理階段實現了 3.1Hz 的極低推理幀率,實現了分鐘級長音頻的實時高保真生成,在推理效率與成本控制上保持業界領先。

業內普遍認為,多模態大模型最終會走向更統一的架構,讓不同模態與任務實現更深層協同。但現實是,“全模態”模型往往很難同時做到通用與專精:在特定單項能力上,開源模型往往不及專用模型。螞蟻集團在全模態方向已持續投入多年,Ming-Omni系列正是在這一背景下持續演進:早期版本構建統一多模態能力底座,中期版本驗證規模增長帶來的能力提升,而最新2.0版本通過更大規模數據與系統性訓練優化,將全模態理解與生成能力推至開源領先水平,并在部分領域超越頂級專用模型。

此次將Ming-flash-omni 2.0開源,意味著其核心能力以“可復用底座”的形式對外釋放,為端到端多模態應用開發提供統一能力入口。

Ming-flash-omni 2.0基于 Ling-2.0 架構(MoE,100B-A6B)訓練,圍繞“看得更準、聽得更細、生成更穩”三大目標全面優化。視覺方面,融合億級細粒度數據與難例訓練策略,顯著提升對近緣動植物、工藝細節和稀有文物等復雜對象的識別能力;音頻方面,實現語音、音效、音樂同軌生成,支持自然語言精細控制音色、語速、情緒等參數,并具備零樣本音色克隆與定制能力;圖像方面,增強復雜編輯的穩定性,支持光影調整、場景替換、人物姿態優化及一鍵修圖等功能,在動態場景中仍保持畫面連貫與細節真實。

百靈模型負責人周俊表示,全模態技術的關鍵在于通過統一架構實現多模態能力的深度融合與高效調用。開源后,開發者可基于同一套框架復用視覺、語音與生成能力,顯著降低多模型串聯的復雜度與成本。未來,團隊將持續優化視頻時序理解、復雜圖像編輯與長音頻生成實時性,完善工具鏈與評測體系,推動全模態技術在實際業務中規模化落地。

目前,Ming-flash-omni 2.0的模型權重、推理代碼已在 Hugging Face等開源社區發布。用戶也可通過螞蟻百靈官方平臺Ling Studio在線體驗與調用。(周小白)

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 91精品国产毛片武则天 | 亚洲综合在线视频 | 在线免费av网站 | 男女操操视频 | 久久国产热视频 | 成人一级片在线观看 | 午夜在线免费观看视频 | av中文天堂| 国产精品久久久久久久久久久久 | av午夜精品 | 日韩在线观看一区二区三区 | 性网站在线观看 | 嫩草在线视频 | 91久久精品国产 | 免费在线黄色网 | 亚洲色图av在线 | 九九av | 欧美区国产区 | 欧美一级性片 | 久久国产精品波多野结衣av | 欧美一区二区三区观看 | 黄色片免费网站 | 午夜生活片 | 99久久成人| 无毒不卡 | 青青青草视频 | aav在线| 精品免费视频 | 亚洲精品一区二区三区区别 | 欧美在线a | 麻豆视频免费入口 | 午夜影院私人 | 亚洲免费精品 | 在线色网 | 九九在线精品 | 性欧美少妇 | 日韩综合一区二区三区 | 波多野吉衣av | av男人的天堂在线 | 天堂婷婷 | 毛片网站免费观看 |