亚洲1024,毛片网站在线,国产3页

過去一年,生成式人工智能在音樂行業的應用正不斷創造新體驗,但歌唱語音合成領域(SVS,Singing Voice Synthesis)整體進展相對緩慢。

為拓展這一領域,近日,Soul App AI 團隊(Soul AI Lab)聯合吉利汽車研究院人工智能中心(AIC)、天津大學視聽覺認知計算團隊和西北工業大學音頻語音與語言處理研究組(ASLP@NPU),正式開源歌聲合成模型SoulX-Singer,這是一個面向真實應用場景設計的高質量零樣本歌聲合成模型,超42000小時訓練數據,覆蓋多語言、多音色及多種演唱風格,在穩定性、可控性與泛化能力方面,均達到了當前開源 SVS 模型中的領先水平。

Demo Page:https://soul-ailab.github.io/soulx-singer/

Technical Report:https://arxiv.org/pdf/2602.07803

Source Code:https://github.com/Soul-AILab/SoulX-Singer

Hugging Face:https://huggingface.co/Soul-AILab/SoulX-Singer

SoulX-Singer介紹

SoulX-Singer 結構簡圖

過去一段時間,語音合成與音樂生成領域迎來了快速發展,大模型與生成式 AI 持續刷新行業認知。然而,與這一熱潮形成對比的是,行業內仍缺乏一個真正穩定可用、同時支持零樣本(Zero-shot)生成的開源歌聲合成(SVS)模型,這很大程度上制約了 SVS 技術在真實業務場景中的應用與落地。

SVS(Singing Voice Synthesis,歌唱語音合成)是一種根據歌詞和樂譜生成歌聲的技術。相比于普通語音合成(TTS,Text-to-Speech Synthesis),SVS 需要對音高、音律以及演唱風格等進行精細控制,以實現自然且富有表現力的歌聲輸出。與近期熱門的 Music Generation(自動生成整段音樂或伴奏)不同,SVS 專注于可由 MIDI 控制的人聲生成,因此在虛擬歌手、歌詞演繹以及多語言歌聲創作等場景中展現出獨特價值。

在這樣的背景下,SoulX-Singer 正式開源。SoulX-Singer 是一個面向真實工業應用場景設計的零樣本歌聲合成模型,其核心目標是在未見過歌手音色的情況下,實現穩定、自然且高度可控的歌聲生成。為此,模型在整體架構、建模范式以及控制機制上進行了針對 SVS 場景的系統性設計。

在模型架構上,SoulX-Singer 采用基于Flow Matching 的生成建模范式,并將歌聲合成問題建模為一種 audio infilling(音頻補全)任務。針對歌聲合成中“歌詞—旋律—發聲”三者強耦合的特點,SoulX-Singer 在建模階段顯式引入了 note 級別的對齊機制。

模型通過構建歌詞、MIDI 音符(note)與聲學特征之間的精細對齊關系,使得每一個音符的起止時間、音高(pitch)以及持續時長都能夠被準確建模和獨立控制。這一設計使得模型不僅能夠忠實還原樂譜信息,還可以在生成階段靈活調整音符結構,從而滿足音樂編輯、重編曲等復雜需求。

大規模 SVS 訓練數據,夯實零樣本能力基礎

零樣本歌聲合成對訓練數據的規模、多樣性與覆蓋范圍提出了極高要求。SoulX-Singer 得益于超過 42000 小時的高質量歌聲數據進行訓練,覆蓋多語言、多音色及多種演唱風格。

在如此大規模數據的支持下,模型在面對未見過的歌手與復雜音樂條件時,依然能夠保持穩定、自然且高質量的合成表現。在實際測試中,SoulX-Singer 展現出了良好的魯棒性和一致性,為零樣本歌聲合成技術從“可演示”走向“可使用”提供了堅實基礎。

Music Score 與 Melody 多種控制方式

在生成控制能力方面,SoulX-Singer同時支持基于Music Score(MIDI) 和基于 Melody 的兩種歌聲合成控制方式:

·Music Score(MIDI)驅動生成支持直接基于樂譜與歌詞生成歌聲,適用于音樂創作、歌詞編輯、歌曲重制等場景,具備音符級別的時長與節奏控制能力。

·Melody驅動生成支持從已有歌曲旋律出發進行歌聲合成,可復刻參考音頻中的演唱技巧與表達方式,適用于翻唱、風格遷移等應用場景。

這種雙控制范式為實際音樂制作流程提供了更高的靈活性,使SoulX-Singer能夠覆蓋從“從零創作”到“基于已有歌曲再創作”的多種使用需求。

多語言支持,面向真實應用場景

SoulX-Singer 當前支持普通話、英語和粵語三種語言的歌聲合成,并在不同語言和音樂風格下均展現出穩定一致的合成質量。這一多語言能力為其在內容創作、虛擬歌手、互動娛樂等應用場景中的落地提供了更廣闊的空間。

客觀表現

在評測方面,SoulX-Singer 在 GMO-SVS 和 SoulX-Singer-eval 兩個數據集上,對零樣本歌聲合成、歌詞編輯后的歌聲合成以及跨語言歌聲合成等多項任務進行了系統評測。

其中,GMO-SVS 綜合了 GTSinger、M4Singer 和 Opencpop 等主流開源 SVS 數據集;而 SoulX-Singer-eval 則專門面向嚴格的零樣本場景構建,通過獨立音樂人等渠道采集數據,確保測試歌手未出現在訓練集中。

實驗結果表明,SoulX-Singer 在語義清晰度、歌手相似度、基頻一致性以及整體合成質量等多個維度上均顯著優于此前的相關工作;在主觀聽感評測中,其表現同樣取得了明顯領先優勢。

盡管此前歌聲合成領域已經涌現出一些優秀的研究工作,但受限于訓練數據規模或控制方式單一等因素,相關模型在真實使用場景中仍面臨諸多挑戰。SoulX-Singer 的發布提供了一個真正魯棒、靈活可控且面向場景落地的零樣本歌聲合成解決方案,為歌聲合成技術在UGC音樂創作等方向的實際應用探索帶來了積極意義。

SoulX-Singer 也延續了Soul AI團隊的開源工作。此前,Soul AI團隊已陸續開源了播客語音合成模型SoulX-Podcast、實時數字人生成模型SoulX-FlashTalk,在語音、歌聲、實時數字人、視頻等不同領域提供了可落地的多模態生成方案。

更多>同類資訊

極智嘉發布全球首款人形通用倉儲機器人，發布即量產！

全球智能機器人引領者極智嘉(Geek+, 2590.HK) 今日正式發布全球首款面向倉儲場景的通用機器人Gino 1。作為“通用倉儲機器人”戰略落地的又一生產力 AI 新作，Gino 1區別于其它人形機器人，它專為倉儲而生，完全面向倉儲場景的通用多任務能力而設計并訓練。其具身大腦 Ge

02-10

店主說：“開九號店，真能賺錢！”——揭秘它的生意經

一代人有一代人的年貨清單，馬年春節，九號電動車成年輕人的潮流年貨。社交媒體上，用戶們爭相創作的“人一旦有了電動車就實現了‘電動車自由’”，成為當下年輕人生活的新打開方式。新年伊始，在行業總體大幅下滑的情況下，九號電動車的新春銷量逆勢增長，尤其是廣東市

02-10

復刻“楚天第一樓”，睿數信息RayZoom G200為晴川閣提供三維空間數字化解決方案，助力數字文保

當前，三維掃描技術正在重塑古建遺址的保護工作流程。其中，三維空間掃描儀以其非接觸、快速、精準、高效獲取古建遺址三維信息的工作方式，能夠為古建遺址提供從精準數字化記錄與存檔、研究分析與修繕輔助到數字化展示與公眾傳播等全方位保護能力。近日，武漢睿數信息利

02-10

亞信科技、格思航天打通星載First Call并簽署合作備忘錄

2月6日，亞信科技(中國)有限公司(簡稱：亞信科技)與上海格思航天科技有限公司(簡稱：格思航天)在上海就低軌衛星互聯網技術合作簽署備忘錄。這標志著亞信科技的空天智連業務正式從戰略規劃走向實質性落地階段。亞信聯合創始人、亞信科技董事長田溯寧博士于線上見證。亞信

02-10

京東生鮮年貨消費觀察：耙耙柑增長12倍、進口牛腱增長6倍背后的年味變遷

“二十三，糖瓜粘;二十四，掃房子”，作為春節前最重要的傳統節日，小年承載著辭舊迎新的美好期盼。這一天，人們祭灶掃塵、吃餃子、煮湯圓，為春節做準備，年貨采辦也進入高峰期。為幫助消費者輕松備齊年貨，2月9日晚8點至2月11日，京東生鮮年貨節福利加碼，多款生鮮爆

02-09

喜迎馬年新春，首部AI賀歲動畫短片集《馬上有戲》溫情上映

當AI技術成為創意的畫筆，將如何描繪天馬行空的想象?2026年馬年新春將至，快手星芒短劇與可靈AI再度合作，推出首部AI賀歲動畫短片集《馬上有戲》，作為國漫，以“春節”為主題展開一系列充滿奇幻與溫情的創意篇章。該系列已于2月6日正式上線，通過動畫風、多風格、中長

02-09

QQ農場回歸，玩家為偷菜花式擴列好友

近日，QQ經典農場正式上線，#QQ農場宣布正式回歸#等多個相關話題登上熱搜，引發了不少熱議。據了解，這款承載著80、90后青春記憶的游戲，憑借經典復刻與創新升級，上線首日就有3500萬玩家沖場，擴列互助群陸續出現，偷菜攻略也在社交圈流傳，這波農場熱，依舊有著不低的

02-09

2026多系統遠程控制app如何選？四款國產主流軟件橫評

目前市場上主流的遠程控制軟件通常都具備跨平臺能力，覆蓋 Windows、macOS、iOS、Android 等常見操作系統，部分產品還進一步適配國產信創系統(如統信 UOS、麒麟 OS)及 ARM 架構設備，滿足個人與企業用戶在不同設備間的遠程協作需求。下面我們將通過四款國內主流遠程控制

02-09

桌面右滑一下，查車票玩游戲，春節各項活動華為負一屏都安排好了

年關將至，春運搶票、親友聚會、旅行過年、春節檔大片…大家是不是已經開始悄悄規劃了?無論是跨越山?；丶覉F圓，還是籌備一場全家出游，又或者是想就近找點新鮮有趣的團聚活動，桌面右滑至華為負一屏，買車票、玩游戲、看電影等等都可以在這里完成。春運路上：信息一屏

02-09

《黑神話悟空》新春特惠華碩B850主板玩家閉眼沖

《黑神話：悟空》官方近期宣布，將在春節期間開啟限時折扣促銷活動，2月10日至24日，游戲在Steam、Epic、WeGame等平臺將開啟七五折史低優惠?！逗谏裨挘何蚩铡啡诤现袊鴤鹘y美學與現代游戲技術，場景古典與現代交織，角色造型細膩多變，光影效果逼真，成為國產游戲新標桿

02-09

首個登陸“超級碗”的中國硬科技品牌誕生！追覓霸屏全美

美國時間2月8日，在號稱全球最具影響力的體育娛樂盛事“超級碗”期間，追覓科技投入千萬美金，攜手獨家轉播平臺NBC重磅亮相賽事黃金廣告位，成為中國首個霸屏全美的硬科技品牌，向全球觀眾展示了中國高端智能科技品牌的實力與形象。成功拿下“超級碗”這一全球品牌競爭

02-09

卡思優派《AI大模型時代數據標注行業洞察與管理實踐》報告正式發布

當AI大模型開始賦能醫療問診、智能駕駛、教育輔導等千行百業，你是否好奇：讓這些智能應用精準落地的幕后英雄是誰?答案是數據標注。作為AI從技術原型走向產業應用的關鍵橋梁，數據標注就像給AI“喂飯”的營養師，直接決定著大模型的認知能力與落地效果。如今，大模型時

02-09

推動“中醫現代化”引領健康生活新范式——煦堂生物桴德五衡茶品牌盛典在京隆重舉行

2026年2月8日，北京訊 —— 在“百歲人生”時代浪潮與科技高速發展的雙重背景下，中醫現代化正成為健康中國戰略的重要引擎。今日，以“推動‘中醫現代化’，引領健康生活新范式”為主題的桴德五衡茶品牌盛典在北京隆重舉行。本次盛典由煦堂生物集團主辦，聚焦于如何以人

02-09

追覓亮相“超級碗”黃金廣告位，成為首個霸屏全美的中國高端智能生態品牌

美國時間2月8日，全美一年一度的體育文化盛事“超級碗”重磅來襲，追覓科技投入千萬美金，登陸賽事獨家轉播平臺NBC的黃金廣告位，向億萬觀眾展示了涵蓋智能出行、智能廚電、智能個護、智能大家電、智能清潔等全場景智能生態，是中國首個霸屏全美的硬科技品牌?！俺壨?/div>

02-09

追覓亮相“超級碗”，成為首個霸屏全美的高端智能科技生態品牌

美國時間2月8日，在全球最具影響力的體育娛樂盛事——美國職業橄欖球大聯盟(NFL)“超級碗”比賽期間，追覓科技登陸賽事獨家轉播平臺NBC的黃金廣告位，30秒千萬美元，向全美億萬觀眾展示了中國高端智能科技品牌的實力與形象，成為中國首個霸屏全美的硬科技品牌，震撼全球

02-09

點擊查看更多 +

全站最新

CLTC續航破千公里！新款騰勢Z9及Z9GT申報信息揭曉，動力配置再升級

國產“雪豹”6×6輪式載具南極顯身手，助力極地考察邁向新階段

國產新一代“雪豹”6×6輪式載具南極顯身手，開啟極地考察新篇章

A股異動丨Seedance2.0 AI視頻生成模型爆紅，AI應用概念集體活躍，中文在線再度逼近漲停

A股影視股集體走強，上海電影等多股漲停，橫店影視創歷史新高

港股異動丨AI應用概念繼續活躍，迅策連續第二日大漲

熱門內容

本欄最新

人人有機會得國民好車！京東“采銷直播比價貴就賠”高潮來襲

鴻蒙游戲進入指數爆發期！超12000款已上架，兩個月數量翻倍

凌波OS的意義：九號把兩輪智能化的規則重新定義

英特爾? 至強? 6處理器純性能核方案：重塑數據中心算力格局

《2025開放式耳機品類趨勢洞察報告》：品類爆發增長，韶音領跑市場與技術雙高地

輕薄實力派 |TECNO SPARK40系列發布，越級體驗，一步到位

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

支持普通話、英語和粵語零樣本歌聲合成，Soul App 聯合吉利汽車研究院人工智能中心（AIC）、天津大學及西北工業大學開源SoulX-Singer

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

支持普通話、英語和粵語零樣本歌聲合成，Soul App 聯合吉利汽車研究院人工智能中心（AIC）、天津大學及西北工業大學開源SoulX-Singer

支持普通話、英語和粵語零樣本歌聲合成，Soul App 聯合吉利汽車研究院人工智能中心（AIC）、天津大學及西北工業大學開源SoulX-Singer