一場聚焦大模型時代推理服務創新發展的專題研討會在中關村論壇期間成功舉行。本次活動由趨境科技與九源智能計算系統生態聯合體聯合主辦,匯聚了院士、頂尖學者及產業領軍人物,共同探討如何構建高效、穩定、安全且普惠的大模型推理服務體系。
活動現場,啟元實驗室副主任劉航與工業和信息化部電子工業標準化研究院副院長郭楠分別致辭。中國工程院院士鄭緯民作為九源智能計算系統生態聯合體理事長,發表了題為《從模型服務到Token服務》的主旨演講。他指出,隨著智能體、AI編程等應用的爆發式增長,2026年已成為"Token爆發元年",產業核心正從模型參數規模轉向Token產能的穩定、低成本與高質量交付。鄭院士強調,未來智能基礎設施需圍繞"Token即服務"重構,通過全系統異構協同、存算協同及面向服務等級協議的智能調度三大核心技術底座,實現全鏈路系統級創新。
趨境科技在會上正式發布新一代AI推理平臺——趨境ATaaS高效能AI Token生產服務平臺。該平臺由趨境科技創始人兼CEO艾智遠與鄭緯民院士等產業界代表共同揭幕。針對硬件資源閑置、軟件適配滯后等四大行業難題,ATaaS平臺通過四大自研核心技術實現突破:全球首創的異構推理2.0技術"六合",可降低萬卡級集群運營成本超20%;超體量KV Cache緩存技術"月餅",將緩存命中率提升至90%,減少90%GPU算力開銷;算子級SLO仿真技術"雙儀",實現算力資源智能預規劃;極致彈性技術"萬象",支持萬億參數模型7秒快速拉起。該平臺日均Token產能達萬億級別,標志著AI基礎設施從"數據中心"向"Token工廠"的演進。
產業生態協同成為本次論壇的另一焦點。并行科技董事長陳健透露,其MaaS服務在趨境科技支持下,將特定場景集群性能提升50%,為多家頭部大模型企業提供服務。九源智能計算系統生態聯合體副秘書長王豪杰介紹,聯合體已推出全國產化GPU適配方案、九齒領域編程語言等成果,推動國產算力從"可用"向"好用"跨越。京東云、華為、阿里云等企業代表分別展示了與趨境科技在推理引擎優化、昇騰AI集群性能提升等領域的合作成果。商湯科技大裝置首席架構師項鐵堯表示,其與趨境科技在Mooncake開源項目上的合作,顯著提升了算力底座的推理效率。
在圓桌討論環節,清華大學副教授章明星與中國移動、天數智芯等機構代表,圍繞國產推理基礎設施發展路徑展開深入探討。與會專家形成三大共識:軟硬深度協同是釋放國產算力潛能的關鍵,需通過系統級優化彌合硬件性能與業務需求差距;生態統一與標準建設對打破適配難題、實現規模化應用至關重要;人才培養需通過開源社區、技術競賽等方式,培育兼具理論與工程能力的復合型人才。
論壇同期宣布啟動2026年春季啟元人工智能大賽,旨在通過賽教融合模式,為國產智能計算生態培育新一代技術人才,持續推動AI產業開源創新與規模化應用。此次研討會的舉辦,恰逢AI產業從模型競爭轉向規模化應用的關鍵轉折點,為產學研用各方搭建了深度交流平臺,為行業高質量發展提供了新思路。







