國內(nèi)AI芯片領(lǐng)域迎來重要突破,一家專注于推理GPU研發(fā)的科技企業(yè)曦望近日宣布完成近30億元戰(zhàn)略融資。本輪融資由三一集團(tuán)旗下華胥基金、范式智能等產(chǎn)業(yè)資本,IDG資本、高榕創(chuàng)投等知名投資機(jī)構(gòu),以及誠通混改基金等國資背景資金共同參與。資金將用于下一代推理GPU的研發(fā)、量產(chǎn)及生態(tài)建設(shè),標(biāo)志著國產(chǎn)AI芯片在推理賽道邁出關(guān)鍵一步。
與傳統(tǒng)GPU廠商聚焦訓(xùn)練場(chǎng)景不同,曦望自成立之初便確立"All-in推理"的戰(zhàn)略定位。公司前身是商湯科技大芯片部門,核心團(tuán)隊(duì)在服務(wù)實(shí)際AI業(yè)務(wù)過程中,積累了模型演進(jìn)、算子優(yōu)化等關(guān)鍵領(lǐng)域的深刻認(rèn)知。這種技術(shù)基因使其在芯片架構(gòu)設(shè)計(jì)上突破傳統(tǒng)訓(xùn)推一體框架,針對(duì)推理場(chǎng)景的調(diào)度、緩存、片上存儲(chǔ)等環(huán)節(jié)進(jìn)行原生優(yōu)化,配合LPDDR內(nèi)存技術(shù),實(shí)現(xiàn)單位Token推理成本顯著降低。
團(tuán)隊(duì)構(gòu)成是曦望的核心競(jìng)爭(zhēng)力之一。聯(lián)席CEO王勇?lián)碛?0年芯片研發(fā)經(jīng)驗(yàn),曾主導(dǎo)AMD、昆侖芯多代產(chǎn)品開發(fā),2020年加入商湯后成功推出兩代量產(chǎn)芯片;另一位聯(lián)席CEO王湛作為百度創(chuàng)始團(tuán)隊(duì)成員,曾管理8000人團(tuán)隊(duì)負(fù)責(zé)搜索業(yè)務(wù),2025年加入后主導(dǎo)公司商業(yè)化進(jìn)程。目前300人的團(tuán)隊(duì)中,70%成員來自NVIDIA、AMD等國際芯片企業(yè),平均行業(yè)經(jīng)驗(yàn)達(dá)15年,形成技術(shù)工程與商業(yè)落地的雙重保障。
在產(chǎn)品布局上,曦望已形成覆蓋視覺推理到大模型全場(chǎng)景的三代芯片矩陣。2020年量產(chǎn)的S1芯片作為國內(nèi)首款視覺推理專用芯片,已授權(quán)索尼、小米等企業(yè)使用;2024年推出的S2芯片兼容CUDA生態(tài),成功適配DeepSeek、Qwen等主流模型;即將發(fā)布的S3芯片通過FP8/FP4低精度推理技術(shù),將單位Token成本降至行業(yè)新基準(zhǔn)的百分之一,目標(biāo)實(shí)現(xiàn)"百萬Token一分錢"的突破性進(jìn)展。公司累計(jì)持有200余項(xiàng)核心專利,且三代產(chǎn)品均實(shí)現(xiàn)"一次流片成功",彰顯技術(shù)成熟度。
這種差異化路線源于對(duì)AI產(chǎn)業(yè)演進(jìn)趨勢(shì)的精準(zhǔn)判斷。當(dāng)模型訓(xùn)練進(jìn)入技術(shù)深水區(qū),推理環(huán)節(jié)的效率、成本和穩(wěn)定性已成為決定商業(yè)化成敗的關(guān)鍵因素。曦望選擇不與通用GPU廠商正面競(jìng)爭(zhēng)參數(shù)指標(biāo),而是通過全棧自研(涵蓋指令集、IP核、編譯工具鏈等)構(gòu)建技術(shù)壁壘,在芯片架構(gòu)、內(nèi)存技術(shù)、生態(tài)兼容等維度形成獨(dú)特優(yōu)勢(shì)。其商業(yè)模式定位為現(xiàn)有算力體系的"推理優(yōu)化層",通過與本土芯片廠商合作構(gòu)建專用加速區(qū),幫助客戶降低30%-50%的推理成本。
據(jù)公開資料顯示,曦望成立至今研發(fā)投入累計(jì)達(dá)20億元,這種持續(xù)高強(qiáng)度投入已轉(zhuǎn)化為顯著的市場(chǎng)優(yōu)勢(shì)。其S2芯片在相同性能下功耗降低40%,成本僅為國際競(jìng)品的60%,已獲得多家互聯(lián)網(wǎng)大廠和AI獨(dú)角獸的測(cè)試認(rèn)證。隨著AI應(yīng)用從訓(xùn)練主導(dǎo)轉(zhuǎn)向推理主導(dǎo),這種聚焦場(chǎng)景經(jīng)濟(jì)性的技術(shù)路線,正在重塑國產(chǎn)AI芯片的競(jìng)爭(zhēng)格局。











