頭部音樂公司們,正在扎堆擁抱AI。
4月2日,哇唧唧哇發布九周年家族曲《āi ái ǎi ài》。在MV中,AI化身為從天而降的巨龍,而23藝位人則以極具想象力的造型登場——他們與AI試探、對抗,最終走向共處與協作。
在這個充滿奇觀敘事的文本背后,更值得關注的是一次行業級技術躍遷:哇唧唧哇在群像型音樂影像生產中深度應用了可靈AI,不僅實現了對23位藝人的統一生成與風格控制,還在近5分鐘的時長內維持了人物形象的高度穩定與敘事連續性。這種完成度,正在抬升AIMV的行業基準。
哇唧唧哇官方稱之為“這是一次WAJI FAMILY向未來的集體表達。”透過這支MV,真正值得被討論的,正是在一個AI深度參與創作的時代,我們該如何理解“未來”?我們又該如何“表達”?
一場人類與AI的“馴龍”共生實驗在異次元的WAJILAND,周震南身披獅耳鎧甲,毛不易騰云駕霧,馬伯騫騎著摩托在沙漠中馳騁,機甲上“生長開花”,構成了一種超現實但又高度統一的美學風格。
在9周年的節點,哇唧唧哇從一開始就沒有打算講個傳統的故事。
對哇唧唧哇來說,每年“司慶”都是一種前瞻性的戰略表達。6周年的“怪6的”,7周年的“7年之young”,8周年的“無限不設限”,到今年9周年的“9ai”——幾乎沒有爭議,AI成為了內部共識。
“AI是一個不可能回避的話題,關鍵在于我們以什么姿態去面對它。”哇唧唧哇項目總策劃陳靜怡這樣解釋。
于是,《āi ái ǎi ài》不只是一個歌名,更像是音樂公司和創作者們的認知路徑:從“āi”的初見與好奇,到“ái”的驚訝與感知,再到“ǎi”的反思與對視,最終落在“ài”的接納與共處。
對于AI的態度,哇唧唧哇選擇了一條更克制、也更務實的路徑——平視。他們刻意使用小寫的“ai”,并賦予其不同聲調,讓一個原本冷冰冰的技術概念,獲得情緒、溫度,甚至敘事能力。
更關鍵的是,這并不只是一個被表達的主題,而是在創作過程中被不斷驗證的現實。
“最難的,從來不是生成畫面,而是讓一張臉在不同結果中保持100%一致。”負責概念美學設定的可靈AI超級創作者辣味花手提到。
在獲得藝人及經紀公司授權后,辣味花手首先運用傳統3D建模技術還原每位藝人的面部結構,并建立私有化的本地人臉庫,在離線安全環境中完成數據處理。隨后,運用可靈AI進行妝造與場景生成:在保持辣味花手獨特畫風穩定性的前提下,辣味花手通過可靈AI為每位藝人量身打造風格各異的視覺造型與空間設定,使23位藝人既呈現出強烈的差異化表達,又在統一的美學語境中保持整體協調性與視覺一致性。
在此基礎上,團隊將3D建模人臉與AI生成的妝造、場景進行精細融合,并通過多輪人工PS進行逐幀校準與精修,持續強化面部還原度與細節真實感,最大程度地還原藝人形象。整個概念設計階段工作量堪稱驚人。每一位藝人發散近 1000 張概念圖,23 位藝人總計產出近 2 萬張初稿,再從中層層篩選,每組留下3-4張最優方案,與哇唧唧哇團隊反復溝通、確認、打磨,最終鎖定每一位藝人的最終形象。這一套流程花了近一半的時間,但也讓MV中的藝人形象真正“像本人、立得住”。
也正是在這種高度不確定的創作中,一套新的工作邏輯悄然成型。
過去的MV制作,更接近一套分工嚴密的工業流水線,各個工種“自掃門前雪”。但在AIGC語境下,單個創作者的能力邊界被急劇放大,一個人開始具備接近一個團隊的產出能力,“超級個體”從概念走向現實。
反饋在作品中,就是那些不可預期、卻極具沖擊力的“意外正確”。
比如那條象征AI的巨龍。最初哇唧唧哇團隊的設想,是更偏東方傳統的視覺表達。但當辣味花手交出一個擁有機械關節、半透明血管中流動著熒光血液的版本時,團隊迅速放棄了原有路徑,新的方案直接抬高了想象力的上限。
創造小劇場的部分時,在那個連接人類過去與未來的空間設定中,創作一度陷入停滯。“寫prompt的時候,我更明確地知道‘不要什么’,而不是清楚知道‘要什么’。”辣味花手坦言。
在這種情況下,AI工具通過高頻試錯逼近答案。直到那個長滿異形蘑菇的粉色洞穴出現,團隊幾乎在瞬間達成共識:這就是他們想要的。某種意義上,這種“由結果反推需求”的路徑,本身就是AIGC時代的新方法論。
在這一邏輯下,辣味花手完成概念與美學設定后,可靈AI超級創作者、MV導演BOB二黑接管整體動效與影像生成,工作流隨之進入高度模塊化階段。
首先是角色一致性的工程化處理:基于可靈O1的角色庫功能,為每位藝人建立“三視圖”的數字身份體系,從源頭鎖定面部結構與形體比例,確保在動態生成過程中不出現面部崩塌、運動跑形等常見問題。
相較于傳統流程中耗時的分鏡繪制與多輪溝通,BOB二黑轉而借助可靈3.0的智能分鏡系統,自動生成機位調度與景別組合,并快速輸出一版帶有專業運鏡邏輯的粗剪雛形。由此,“成片感”被前置至創作初期,讓團隊能夠圍繞一個具體結果進行判斷與校準。
“效果可以達到傳統動畫的80%-90%”,BOB二黑如此評價。MV中部分卡通角色的舞蹈,正是基于這一能力,將定格動畫、玩偶等風格“激活”為動態表達。在最終交付層面,生成視頻已可達到2K-4K清晰度,滿足商業級制作標準。
也正因此,這支MV的意義不止于一次風格化表達,而在于它跑通了一套可復制、可商用、可規模化的AIGC音樂影像全流程,從制作、審美決策到宣發體系,完成了真正的一體化嵌入。
《āi ái ǎi ài》四個聲調的“ai”,既是語言游戲,也是態度聲明——對于頭部音樂公司而言,AI早已不是“要不要用”的問題,而是一個必須長期共處、持續探索的創作變量。
MV生產邏輯會被徹底改寫嗎?伴隨著用戶從“聽音樂”向“看音樂”的消費行為遷移,全球音樂傳播結構正在發生顯著變化,并進一步推動MV制作市場的持續擴張。
Verified market research的研究報告預測,到2032年全球MV制作市場的規模將達到 203.9 億美元,2026年至2032年的復合年增長率將達到7.8%。相較于商業廣告MV,音樂專輯類MV占據了最大的市場份額,達到70.65%,市場價值達79.15億美元,預計在預測期內將以8.39%的最高復合年增長率增長。
那么,如何在呈現出MV中呈現出更多可能性,以及在迅速擴張的音樂視覺經濟中占據主動地位?
目前來看,積極擁抱AI,打破內容邊界,成為了眾多頭部音樂公司的首選。?
從華納音樂與可靈AI合作的邵氏風虛擬俠女偶像《吳愛花》,到說唱歌手艾熱與可靈AI合作的基于可靈AI生成能力實現多重空間自由切換的《在指尖跳舞》,再到借助可靈AI細化情緒表達、提升影像顆粒度的時代少年團六周年MV《I Like U Like》,直至此次哇唧唧哇的23人群像MV,一條清晰的路線浮現:可靈 AI 正在從 “內容生成工具”,升級為 “可商用交付的創意生產力平臺”。
對于哇唧唧哇這樣的頭部音樂公司來說,MV早已不是單一作品,而是整個宣發鏈路中的核心視覺資產。這也意味著,他們對AIMV的要求不再停留在“能不能做”,而是三連問:能否穩定生成?能否符合商業交付標準?能否助力商業宣發需求?
在這個意義上,以可靈AI為代表的AI工具的真正價值,正在于此:重構工作流、擴展創意邊界,以及大大降低檔期的協調成本。
以這一次的《āi ái ǎi ài》項目為例,在哇唧唧哇完成整體企劃與創意方向設定之后,項目迅速進入以AI為核心驅動的生產階段:從概念設計、分鏡生成、動畫合成與后期剪輯等關鍵環節,進而形成一條高度一體化、端到端銜接的數字化生產流程。
具體而言,AI首先基于文本提示、面部建模與視覺參考完成概念設定與風格統一,在源頭上建立內容的美術語言與視覺一致性;借助智能分鏡系統,概念設計圖生成鏡頭調度與機位設計,并輸出具備基礎敘事邏輯的動態粗剪版本;隨后進入動畫生成與動作綁定階段,使人物表演與鏡頭運動實現精準匹配;最終在剪輯與合成環節完成節奏控制、視聽匹配與整體包裝,使內容直接進入可分發、可傳播的“成片形態”。
“當你用AI做一支片子,不再去走實拍的老路線。”可靈AI超級創作者BOB二黑提到,“你就要找一個非常有意思的、不同以往的點去切入,可以嘗試不同的風格類型,也可以在相同的成本中疊加更多的想法。”
拍攝條件、制作周期這些曾經決定上限的變量被削弱,大量過去“想得到但做不到”的視覺設想,開始進入可執行區間。創作者不再圍繞資源做減法,而是圍繞想象力做加法。
成本層面,AI不是簡單降低成本,而是重構了成本結構。從傳統的場地、置景、拍攝、妝造、人員等“物理成本”,轉向算力與創作者投入。傳統企劃往往受制于預算約束、藝人檔期與物理空間條件,而AI的介入顯著削弱了這些限制:23位藝人可以在虛擬空間中完成“同框演出”。
正如哇唧唧哇項目總策劃陳靜怡所言:“過去討論執行方案,核心問題始終是‘是否可實現’;而現在,只要能夠被想象出來,基本就能夠被實現。”
最直觀的是周期:傳統 CG 制作同等復雜度 MV,至少需要半年;而 AI 模式下,從動態生成到整體項目的周期都被大大壓縮。時間成本的斷崖式下降,正在重新定義內容生產的節奏與規模邊界。但與此同時,也顯著抬高了對創作者綜合能力的要求。
可靈AI超級創作者辣味花手的感受極具代表性:AI正在塑造一種新的審美生產機制,過去需要一個完整3D團隊協作完成的內容,如今可以由個人實現。這并不意味著創作變得輕松,反而意味著創作者需要在高頻試錯中快速迭代審美判斷與風格控制能力。
“我refer我自己。”她告訴音樂先聲。在持續的創作嘗試中,她把可靈AI這樣的平臺用成了“復制腦”,形成了她在平臺上頗具辨識度的風格,讓她的作品走向更廣泛的商業化空間。
這也印證了一個趨勢:AI并沒有削弱創作者,反而在重新定義創作者價值。技術能力逐漸普及之后,審美判斷、風格建構能力,以及對藝人特質的理解,開始構成新的核心壁壘。
在AIGC語境下,算力只是入場券,創意決定上限,市場驗證價值,這三層結構共同定義了內容生產的新坐標。
AI奇點時刻,MV創作天花板在哪里?如今,可靈 AI 早已不是小范圍試水,而是穩步進入主流制作體系。
例如,《太平年》中選擇用可靈AI來制作烏鴉食腐肉的鏡頭,《馬上有戲》等首部AI賀歲動畫短片集在可靈AI加持下拓展著題材邊界,刷屏的破億清明AI短片《紙手機》則證明可靈AI同樣可以承載高情感濃度的敘事表達。
AI早已不再是先鋒導演的嘗試,不再是項目中的“亮點技術”,而是一種可以被標準化調用、嵌入生產流程的通用能力——適配不同屏幕形態、不同內容結構,從長劇到短劇,從豎屏到4K,均可復用。
在此背景下,MV正在成為AI技術最具切入價值的內容形態。
從傳播績效來看,海外咨詢機構Wifitalent數據顯示,官方MV在社交媒體上的互動量較純音頻內容平均高出約300%;自2021年以來,移動端MV觀看量同比增長約40%。同時,用戶在觀看MV后進行付費或歌曲消費的轉化概率約為未觀看用戶的1.8倍,付費轉化率更高。
如此一來,內容供給效率成為影響音樂傳播效果的關鍵變量。
然而,傳統MV生產模式以線性制作流程為主,整體制作周期長、跨團隊協調成本高,儼然已難以適配當前快速迭代的內容傳播節奏與高頻宣發需求。而在多藝人或復雜制作場景中,生產周期與檔期協調進一步增加了難度和成本。
在此背景下,AI通過降低拍攝依賴與縮短后期制作周期,AI技術能夠顯著提升視覺內容的生成效率,使音樂公司能夠在更短周期內完成多樣化內容輸出,提升新歌發行階段的內容響應能力與傳播覆蓋效率。
但更深層的變化,仍然發生在創意維度。
當空間可以被任意折疊,角色可以在多重形態之間自由切換,現實世界的物理約束逐漸失效,MV不再局限于影棚內的表演與調度,而是可以進入更開放的想象空間,探索更復雜的敘事結構與感官體驗,“MV如何視覺呈現歌曲內容”這一個核心命題服務。
作為可靈AI超級創作者辣味花手的判斷頗具代表性:AI正在重塑一套新的審美邏輯。對行業而言,技術本身正在快速“去稀缺化”,真正稀缺的,變成了如何使用技術——審美判斷、風格構建、藝人理解、創意把控。
當創意不再受制于物理世界,MV的上限不再由預算決定,而是由想象力與判斷力共同劃定。而可靈AI也正在把這一變化繼續向深處推進,通過打造連接創作者與商業公司的平臺,完成AIGC從創意靈感到到商用交付的閉環。
這才是這支MV更隱含的命題:AI沒有取代創作者,但它正在迫使人類重新回答一個更底層的問題——當工具趨近于無限,個體的獨特性從何而來?
或許,答案已經被寫進結尾。《āi ái ǎi ài》的最后一行提示不是終點,而是一個開放指令——Game not over。對音樂行業、創作者與廠牌而言,下一步,不是被動地適應AI,而是完成一次真正的“level up”:把重復勞動交給技術,把審美、情感與靈魂,還給人本身。











