1月27日,在曦望2026 SGS產(chǎn)品發(fā)布會上,范式智能創(chuàng)始人戴文淵與國產(chǎn)GPU廠商曦望聯(lián)席CEO王湛共同宣布,推出“百萬Token一分錢”推理成本計劃。雙方將以范式智能PhanthyCloud云服務(wù)與曦望新一代推理GPU芯片啟望S3的深度融合,將大模型推理成本降至每百萬Token僅需1分錢,為AI技術(shù)的規(guī)模化應(yīng)用提供更經(jīng)濟的解決方案。

當前,大模型推理成本是制約AI落地的重要因素。行業(yè)數(shù)據(jù)顯示,主流大模型服務(wù)的輸入Token價格約為0.4至2元/百萬,輸出Token價格約為1至4元/百萬。這使得處理長文檔、高頻交互等場景的成本壓力顯著,例如,10萬字文檔的智能總結(jié)成本可能超過1元。同時,國產(chǎn)算力生態(tài)面臨模型適配難、資源利用率低等挑戰(zhàn),部分場景下GPU利用率不足40%。
針對這些問題,范式智能與曦望通過技術(shù)合作推出“百萬Token一分錢”計劃。該計劃基于曦望啟望S3推理GPU芯片,通過原生支持FP8/FP4低精度推理和定制化架構(gòu)優(yōu)化,在典型場景下實現(xiàn)單位Token成本降低約90%。范式智能的PhanthyCloud云服務(wù)平臺則通過HAMi vGPU社區(qū)優(yōu)化資源調(diào)度,提升GPU利用率;依托“信創(chuàng)模盒 ModelHub XC”大模型社區(qū),解決國產(chǎn)芯片與主流模型的兼容問題;結(jié)合先知平臺,為金融、能源等領(lǐng)域提供業(yè)務(wù)導向的推理服務(wù)。


“當推理成本低到可以忽略不計,AI才能真正從‘奢侈品’變?yōu)椤沼闷贰!狈妒街悄軇?chuàng)始人戴文淵表示,“我們與曦望的合作,是踐行‘AI for Everyone'使命的關(guān)鍵一步。PhanthyCloud作為算力放大器,讓國產(chǎn)芯片的性價比優(yōu)勢在真實業(yè)務(wù)中充分釋放,助力中小企業(yè)、政務(wù)機構(gòu)等以極低成本擁抱智能化。”
曦望董事長徐冰指出:“行業(yè)正從‘堆參數(shù)’轉(zhuǎn)向‘拼成本、拼體驗’。啟望S3與‘百萬Token一分錢’計劃的推出,標志著國產(chǎn)推理芯片已具備支撐產(chǎn)業(yè)級應(yīng)用的成熟度。我們期待與范式智能共同推動算力普惠,加速信創(chuàng)生態(tài)閉環(huán)。”

這一合作源于范式智能與曦望對行業(yè)現(xiàn)狀的務(wù)實分析。業(yè)內(nèi)專家認為,此舉有望成為AI基礎(chǔ)設(shè)施發(fā)展的分水嶺,推動行業(yè)從“技術(shù)驗證”全面邁入“規(guī)模應(yīng)用”新階段。
“百萬Token一分錢”計劃的目標是降低推理成本。通過PhanthyCloud平臺和曦望S3芯片的結(jié)合,雙方致力于提升國產(chǎn)算力的實際應(yīng)用價值。未來,范式智能與曦望將繼續(xù)深化合作,優(yōu)化技術(shù)方案,推動算力普惠,為AI的規(guī)模化落地提供支持。
關(guān)于曦望
曦望(Sunrise)是中國全棧自研AI算力芯片企業(yè),專注大模型推理GPU研發(fā)。2025年芯片交付量突破萬片,近一年完成約30億元戰(zhàn)略融資。公司前身為商湯科技大芯片部門,持續(xù)推動國產(chǎn)算力生態(tài)成熟與普惠。
關(guān)于范式智能
范式智能技術(shù)集團股份有限公司是全球領(lǐng)先的通用人工智能科技公司,以“AI for Everyone"為使命,致力于通過“AI Agent + 世界模型”技術(shù)路線賦能千行百業(yè)。公司成立于2014年,業(yè)務(wù)覆蓋企業(yè)服務(wù)、消費電子、智慧能源、智慧體育等領(lǐng)域,已在全球落地超10,000個AI應(yīng)用。











