今日,稀宇科技旗下MiniMax團(tuán)隊(duì)正式推出新一代AI音樂生成模型——MiniMax Music 2.5,憑借在音樂結(jié)構(gòu)控制與聲音還原技術(shù)上的雙重突破,該模型被業(yè)界視為AI音樂創(chuàng)作領(lǐng)域的里程碑式產(chǎn)品。其核心優(yōu)勢(shì)在于將專業(yè)音樂制作流程與AI技術(shù)深度融合,使普通用戶無需專業(yè)設(shè)備即可完成接近錄音室品質(zhì)的音樂創(chuàng)作。
在音樂結(jié)構(gòu)控制方面,模型首次實(shí)現(xiàn)全段落標(biāo)簽化創(chuàng)作。開發(fā)者通過構(gòu)建包含14種音樂結(jié)構(gòu)變體的控制體系,覆蓋從Intro前奏到Hook副歌的全流程創(chuàng)作需求。用戶可像專業(yè)作曲家般預(yù)先設(shè)計(jì)情緒曲線走向、高潮段落位置及樂器編配方案,徹底改變傳統(tǒng)AI音樂生成后反復(fù)調(diào)整的創(chuàng)作模式。這種"所見即所得"的控制方式,使復(fù)雜音樂作品的創(chuàng)作效率提升數(shù)倍。
聲音還原技術(shù)方面,模型通過三項(xiàng)關(guān)鍵創(chuàng)新實(shí)現(xiàn)質(zhì)的飛躍。在人聲處理上,突破性解決轉(zhuǎn)音連貫性、顫音自然度等難題,支持胸腔與頭腔共鳴的智能切換。當(dāng)處理男女對(duì)唱時(shí),系統(tǒng)能自動(dòng)分析聲線特征,生成具有和聲層次與問答交互的復(fù)合聲部,而非簡(jiǎn)單疊加音軌。在樂器表現(xiàn)上,100+種專業(yè)音色庫(kù)配合智能混音算法,確保在密集編曲場(chǎng)景下仍能保持各聲部清晰可辨,徹底解決AI音樂常見的聲部混疊問題。
針對(duì)華語音樂市場(chǎng)特性,研發(fā)團(tuán)隊(duì)構(gòu)建了專項(xiàng)優(yōu)化體系。模型深度學(xué)習(xí)從抒情慢歌到說唱節(jié)奏的多樣風(fēng)格,精準(zhǔn)把握中文發(fā)音的韻律特點(diǎn),在中英文混搭創(chuàng)作中實(shí)現(xiàn)自然過渡。經(jīng)實(shí)測(cè),在流行音樂傳播性關(guān)鍵指標(biāo)上,生成作品的可聽度較前代提升40%,更符合亞洲聽眾的聽覺習(xí)慣。
專業(yè)應(yīng)用場(chǎng)景適配能力是該模型的另一大亮點(diǎn)。通過與影視、游戲、廣告等行業(yè)制作流程的深度對(duì)接,模型可輸出符合敘事節(jié)奏的配樂、支持空間音頻的游戲音效,以及具備品牌辨識(shí)度的定制化聲效。在流行音樂工業(yè)領(lǐng)域,其生成作品已達(dá)到可直接進(jìn)入錄音棚混音的交付標(biāo)準(zhǔn),顯著縮短音樂制作周期。
技術(shù)白皮書顯示,MiniMax Music 2.5采用多模態(tài)大模型架構(gòu),在3000萬小時(shí)音樂數(shù)據(jù)基礎(chǔ)上完成訓(xùn)練。其創(chuàng)新性的物理聲學(xué)建模技術(shù),使樂器音色還原度達(dá)到專業(yè)音頻設(shè)備測(cè)量標(biāo)準(zhǔn),人聲動(dòng)態(tài)范圍壓縮誤差控制在0.5dB以內(nèi)。這些技術(shù)突破為AI音樂商業(yè)化應(yīng)用開辟了新路徑,目前已有多家音樂平臺(tái)啟動(dòng)合作測(cè)試。











