谷歌近日宣布,其Gemini應用完成重要升級,正式整合DeepMind旗下前沿音樂生成模型Lyria 3。這項技術突破使得用戶僅需輸入文字描述或上傳圖片,即可在短時間內獲得一段30秒的完整音樂作品,涵蓋人聲、歌詞與伴奏的完整創(chuàng)作鏈條。
在創(chuàng)作維度上,Lyria 3展現(xiàn)出高度靈活性。用戶既可以通過文字指令指定音樂風格、情緒基調或節(jié)奏類型,系統(tǒng)將自動生成匹配的完整曲目;也能上傳視覺素材,模型通過分析畫面色彩、構圖與氛圍,輸出與之契合的背景音樂,并配備由AI設計的專屬封面藝術。針對短視頻創(chuàng)作者,YouTube平臺特別推出Dream Track功能,目前已在北美地區(qū)上線,支持為Shorts內容快速配樂。
資本市場對這項技術革新反應迅速。消息公布當日,流媒體巨頭Spotify股價盤中漲幅收窄近5個百分點,衛(wèi)星廣播服務商Sirius XM股價亦出現(xiàn)短暫回調。行業(yè)觀察人士指出,雖然Lyria 3短期內難以撼動現(xiàn)有音樂平臺的用戶基礎,但可能促使競爭對手加速布局AI混音等智能化功能。
谷歌在技術落地過程中著重構建版權保護機制。當用戶提示涉及真實音樂人時,系統(tǒng)僅將其作為風格參考對象,生成相似氛圍的作品而非直接模仿,同時內置內容過濾器防止侵權輸出。所有創(chuàng)作成果均采用SynthID技術嵌入隱形數(shù)字水印,確保AI生成內容的可追溯性。
面對音樂行業(yè)對生成式AI的普遍憂慮,谷歌通過技術手段劃定創(chuàng)新邊界。這項升級既增強了消費級產品的市場競爭力,也向投資者展示了人工智能技術的商業(yè)轉化潛力。目前該服務已面向全球成年用戶開放,支持英、德、西、法、印地、日、韓、葡等八種語言,后續(xù)計劃拓展更多語種并優(yōu)化音質表現(xiàn)。









