中國人工智能領(lǐng)域再迎重要進(jìn)展,大模型創(chuàng)業(yè)公司階躍星辰近日宣布開源其Step 3.5 Flash模型的完整技術(shù)棧。此次開源內(nèi)容不僅包含預(yù)訓(xùn)練權(quán)重(Base)和中訓(xùn)練權(quán)重(Midtrain),還同步開放了自主研發(fā)的Steptron訓(xùn)練框架,為全球開發(fā)者提供全鏈路技術(shù)支撐。
該模型采用創(chuàng)新的稀疏MoE架構(gòu),總參數(shù)量達(dá)1960億,但通過動態(tài)參數(shù)激活機(jī)制,實(shí)際推理時僅需調(diào)用約110億參數(shù)。這種設(shè)計(jì)使其在保持強(qiáng)大性能的同時,將單請求代碼任務(wù)的推理速度提升至每秒350次(TPS),在復(fù)雜邏輯處理和長序列任務(wù)中展現(xiàn)出顯著優(yōu)勢。技術(shù)團(tuán)隊(duì)透露,模型特別針對智能體(Agent)應(yīng)用場景進(jìn)行優(yōu)化,其推理深度已達(dá)到部分國際頂尖閉源模型的水平。
開源社區(qū)對這項(xiàng)技術(shù)成果表現(xiàn)出極大熱情。數(shù)據(jù)顯示,Step 3.5 Flash模型在Hugging Face平臺的累計(jì)下載量已突破30萬次,并連續(xù)兩周占據(jù)OpenRouter趨勢榜首位。在由中國開發(fā)者主導(dǎo)的開源項(xiàng)目OpenClaw(昵稱"小龍蝦")中,該模型更是一舉沖入綜合排名前二,成為亞洲地區(qū)首個進(jìn)入該榜單前列的超大規(guī)模模型。
行業(yè)觀察人士指出,此次開源標(biāo)志著中國在大模型技術(shù)領(lǐng)域?qū)崿F(xiàn)從應(yīng)用追趕向基礎(chǔ)創(chuàng)新的跨越。通過開放核心訓(xùn)練框架和權(quán)重參數(shù),階躍星辰不僅降低了全球開發(fā)者構(gòu)建智能體的技術(shù)門檻,更為多模態(tài)Agent生態(tài)的繁榮發(fā)展提供了關(guān)鍵基礎(chǔ)設(shè)施。隨著更多開發(fā)者基于該框架進(jìn)行二次開發(fā),預(yù)計(jì)將催生出覆蓋工業(yè)、醫(yī)療、教育等領(lǐng)域的創(chuàng)新應(yīng)用。











