鳳凰網(wǎng)科技訊 3月4日,中國(guó)大模型創(chuàng)業(yè)公司階躍星辰繼開(kāi)源Step 3.5 Flash模型后,又開(kāi)源了這款A(yù)gent基座模型的預(yù)訓(xùn)練權(quán)重(Base)、中訓(xùn)練權(quán)重(Midtrain)以及配套的Steptron訓(xùn)練框架。
據(jù)了解,Step 3.5 Flash采用稀疏MoE架構(gòu),總參數(shù)1960億,但推理時(shí)僅激活約110億參數(shù),單請(qǐng)求代碼任務(wù)下推理速度最高可達(dá)350TPS。該模型專(zhuān)為智能體(Agent)場(chǎng)景設(shè)計(jì),在復(fù)雜推理和長(zhǎng)鏈任務(wù)中表現(xiàn)出色,官方稱(chēng)其推理深度可媲美部分頂級(jí)閉源模型。
截至目前,這款模型在Hugging Face上下載量已超30萬(wàn)次,并登上OpenRouter Trending第一名。而在知名開(kāi)源項(xiàng)目OpenClaw(被中國(guó)網(wǎng)友稱(chēng)為“小龍蝦”)上,該模型排名已升至前二。











