階躍星辰近日正式宣布,其研發的多模態模型Step3-VL-10B已實現開源。這款模型以僅10B的參數量,在視覺感知、邏輯推理、數學競賽及通用對話等多個基準測試中,均展現出與同規模模型相比的領先性能,達到SOTA(State-of-the-Art)水平。尤為引人注目的是,Step3-VL-10B成功突破了參數量與智能水平難以兼顧的技術瓶頸,為行業帶來了新的突破。

在多項權威評測中,Step3-VL-10B的表現令人矚目。它不僅與參數量大10至20倍的開源模型(如GLM-4.6V 106B-A12B、Qwen3-VL-Thinking 235B-A22B)不相上下,甚至在某些方面超越了這些模型。同時,它還展現出了與頂級閉源旗艦模型(如Gemini 2.5 Pro、Seed-1.5-VL)相媲美的實力,進一步證明了其技術的先進性和實用性。
Step3-VL-10B的開源,為多模態推理技術的普及和應用開辟了新的道路。基于這一小而強的模型底座,原本只能在云端運行的復雜多模態推理任務,如GUI操作、復雜文檔解析以及高精度計數等,現在可以輕松下沉到手機、電腦甚至工業嵌入式設備中。這不僅大大降低了技術應用的門檻,也為更多行業和場景帶來了智能化升級的可能。
值得一提的是,階躍星辰此次不僅開源了Base模型,還同時開源了Thinking模型。這一舉措無疑將進一步推動多模態模型技術的發展和應用,為行業內的研究者、開發者提供更多選擇和可能性。











