快手旗下可靈AI團隊近日披露了其從行業新銳躍升為全球視頻生成領域頭部玩家的關鍵決策路徑。這款以"讓每個人成為導演"為愿景的產品,通過兩次顛覆性選擇和一套獨特的組織方法論,在OpenAI等巨頭環伺的賽道中開辟出差異化道路。
2024年初,當OpenAI發布Sora Demo引發行業震動時,可靈團隊卻做出了一個令內部嘩然的決定——在資源極度匱乏的情況下,搶先推出全球首個用戶可用的視頻生成模型。彼時團隊僅能調用"非主流"算力資源,但負責人蓋坤判斷OpenAI將回歸語言模型主戰場,果斷下令5個月內完成全鏈路開發。這一冒險舉措最終收獲回報:可靈1.0于2024年6月上線,比Sora正式發布提前半年占據市場先機。
在取得先發優勢后,團隊面臨更艱難的抉擇:是繼續優化現有模型的清晰度與穩定性,還是轉向尚未有成功案例的多模態交互。蓋坤選擇將圖像、視頻、動作等元素統一為AI語言,開發出動作控制功能。這項允許用戶通過參考視頻復刻角色動作的創新,未經大規模推廣便在海外市場引發病毒式傳播,印證了技術落地的市場潛力。
支撐這些戰略選擇的是一套突破傳統互聯網方法論的決策體系。蓋坤指出,大模型時代單次嘗試成本高達千萬美元,傳統AB測試已失效。可靈團隊轉而依賴"愿景牽引"模式,在DiT架構、多模態融合等關鍵節點,通過少數核心成員的判斷力鎖定方向。這種"法師式"創新策略與OpenAI的"女神式"高冷路線形成鮮明對比,后者雖技術驚艷但落地緩慢。
執行層面,可靈采用"爭議前置+絕對執行"原則。重大決策初期鼓勵充分辯論,但目標確定后要求全員投入120%資源。蓋坤特別強調避免"口頭同意,執行變形"的現象,這種強執行力文化確保了戰略方向的精準落地。
技術演進與商業化的雙重驗證支撐著團隊愿景。2025年第四季度,可靈AI實現營收3.4億元人民幣,12月單月收入突破2000萬美元。蓋坤認為,當AI生成內容的可控性與質量達到臨界點,將催生全新的內容基礎設施。他以《紙手機》等爆款為例,指出技術正在打破創作門檻,讓普通人腦海中的故事得以具象化呈現。
目前,可靈團隊正推進一體化模型研發,試圖將文本、圖像、視頻、3D資產的生成能力整合為統一框架。這種技術路線與商業化的良性互動,正在重塑內容產業的生產邏輯——當每個人都能用AI將想象轉化為作品時,內容平臺的形態與價值評估標準都將發生根本性變革。













