3月12日消息,作為國產大模型中最受期待的明星,DeepSeek V4最近一直被傳發布,但都落空了,現在又有新的大模型引發熱議。
這次又是在OpenRuter平臺出現的,而且是兩個型號,一個代號Hunter Alpha,1萬億參數量,而且支持1M上下文,多模態輸出。
另一個代號Healer Alpha,262K上下文,也是多模態,但沒有公布參數量,輸出速度更快。
很多人猜測Hunter Alpha就是即將發布的DeepSeek V4,但AI大模型評測大佬@karminski-牙醫表示它不是V4,還是智譜的新模型,可能是智譜新一代旗艦大模型。
如果了解過DeepSeek的風格,大家也應該認為不是V4,DeepSeek發布新品之前沒有在Openruter這樣測試過,而是習慣低調上線,之后在群里發布一則簡短的消息確認有新品。
DeepSeek V4這幾天也有很多網傳的新正經,比如1萬億參數量,MOE激活320億參數,1M上下文,原生多模態,并且為昇騰910C平臺優化,而不是只為NVIDIA或者AMD等國外芯片優化。
不過這些爆料可信度一般,目前比較可信一點的反而是下面這一條:知名量化專家@bdsqlsz被發現在HuggingFace上傳了DeepSeek-V4-INT8權重,暗示了V4支持INT8算法,更關鍵的是這意味著V4這次真的差不多要發布了。
還有爆料說DeepSeek要求供應商在6-20號期間保持穩定,最近兩天還在做最后的壓力測試,很快就能發了。
反正耐心等等吧,好飯不怕晚。











