近日,AI領域迎來一則重磅消息:開源推理框架vLLM的核心團隊正式創立初創公司Inferact,并以8億美元的投前估值完成1.5億美元種子輪融資。本輪融資由Andreessen Horowitz(a16z)與Lightspeed Venture Partners聯合領投,為這家新銳企業注入強勁資本動力。
此次融資不僅印證了市場對vLLM商業化路徑的長期關注,更折射出AI行業戰略重心的遷移——從側重模型訓練轉向強化應用推理環節。據行業分析,推理環節的效率提升將直接決定AI技術的落地速度與成本結構,這成為資本競相布局的關鍵因素。
Inferact的技術基因可追溯至加州大學伯克利分校Ion Stoica教授實驗室。作為Databricks聯合創始人,Ion Stoica團隊研發的vLLM框架通過突破性顯存管理技術,在保持模型精度的同時,將大模型運行速度提升數倍,并顯著降低能耗。這種技術優勢使其開源版本迅速獲得行業認可,目前已被亞馬遜云服務(AWS)及亞馬遜電商等頭部企業采用。
值得關注的是,Inferact并非伯克利實驗室孵化的唯一明星項目。與其形成"雙雄"格局的RadixArk同樣源自該校,該團隊基于SGLang框架開發的商業化產品,近期剛完成由Accel領投的4億美元估值融資。兩家企業接連獲得頂級資本青睞,凸顯投資者對高效AI部署技術的戰略布局——通過優化推理環節,構建更具成本效益的AI基礎設施。
據知情人士透露,Inferact計劃將本輪融資用于技術研發與生態建設,重點拓展企業級客戶市場。隨著AI應用場景的指數級增長,推理環節的效率瓶頸日益凸顯,這家擁有學術基因的初創企業能否突破技術天花板,將成為影響行業格局的重要變量。





