在數字化浪潮中,企業每天產生的視頻數據量呈爆炸式增長,但其中大部分因缺乏有效分析手段而淪為“暗數據”,難以發揮實際價值。如何將海量視頻轉化為可利用的數字資產,成為視頻AI領域亟待突破的課題。近期,日本東京的初創公司InfiniMind宣布完成580萬美元種子輪融資,其核心目標正是通過技術創新解決這一難題,為企業提供PB級視頻數據的深度處理能力。
InfiniMind由兩位前谷歌員工聯合創立,創始人Aza Kai與Hiraku Yanagita在谷歌擁有近十年的合作經驗。Aza Kai曾主導亞太地區數據科學團隊,專注于大規模機器學習解決方案設計;Hiraku Yanagita則深耕數字營銷領域,為企業客戶提供數據分析服務。兩人觀察到,盡管云服務廠商能檢測視頻中的人或車輛,但僅停留在簡單標記層面,無法理解上下文關系;新一代視頻AI模型雖能處理內容,卻受限于時長,難以滿足企業數天甚至數年的視頻分析需求。
基于這一洞察,InfiniMind開發了視頻理解基礎設施,旨在將視頻轉化為結構化、可搜索的企業數據。其技術突破在于整合視覺、音頻、語音等多模態信息,通過統一數據流處理長視頻片段中的因果關系。例如,在安全事件場景中,系統不僅能檢測人員或車輛,還能追蹤“誰進入現場、接觸了什么、去了哪里、最終發生了什么”的完整敘事鏈,形成可查詢的知識庫,直接集成到企業商業智能工具中。
公司首款產品TVPulse于2025年4月發布,專注于電視廣播數據分析。該產品利用AI實現逐秒搜索,幫助媒體和零售企業追蹤產品曝光、品牌影響力及競品動態,目前已為批發商和媒體行業客戶提供服務,累計分析內容超10萬小時。旗艦產品Deepframe則進一步拓展能力,可處理200小時視頻音頻素材,精確定位特定場景、演講者或事件。該產品計劃于今年3月測試、4月正式發布,其核心優勢在于通過微調工廠生成行業專用模型,幫助客戶在成本、精度和速度間實現平衡。
與通用視頻分析API不同,InfiniMind專注企業級部署,提供虛擬私有云(VPC)和本地化解決方案,滿足數據主權要求——這一特性解決了許多組織采用云端AI時的關鍵障礙。Aza Kai表示,公司技術突破得益于視覺語言模型的進步:“過去十年,GPU成本下降和性能提升固然重要,但模型能力的提升才是關鍵。”2021年至2023年,隨著技術成熟,兩人決定創立InfiniMind(曾用名SDio),并分別擔任CEO和COO。
目前,InfiniMind在東京擁有十余名員工,并與東京大學研究團隊展開合作,共同推進模型評估和視頻理解基準測試。公司已入選AWS生成式人工智能加速器、日本經濟產業省GENIAC計劃、NVIDIA Inception計劃及Google for Startups云計劃,技術實力獲多方認可。本輪融資由亞洲深度科技風投公司UTEC領投,CX2、Headline Asia Ventures等機構跟投,資金將用于深化Deepframe模型開發、擴展工程基礎設施、招聘工程師及拓展日美市場客戶。
據公開信息,InfiniMind計劃將總部遷至美國,同時保留日本辦公室,以進一步整合全球資源。隨著企業視頻數據價值日益凸顯,其技術路徑或為行業提供新的參考方向。

















