2月11日消息,這個春節全網都在等DeepSeek發布最新的大模型DeepSeek V4,但是現在來看大版本不一定會在春節期間發布,今天DeepSeek悄然更新了新版本,亮點不少。
根據DeepSeek自己的介紹,這次更新主要是提升了上下文能力,達到了1M,而之前的DeepSee V3系列也就是128K。
有了1M上下文,DeepSeek可以一次性處理《三體》三部曲這樣體量的超長文本,這點已經得到了很多網友的實測證實。
其他方面的能力是之前就有的,DeepSeek也沒有提及更詳細的信息。
值得注意的是,DeepSeek在回答完這個問題之后還特別加了一段,強調它就是最新的DeepSeek模型,沒有特定的子名稱,不是V3也不是R1,彷佛在刻意強調這個模型的不同,但又不讓人產生這就是V4 Preview預覽版的聯想。
但是從網友的反饋來看,這次DeepSeek的小更新實際上能力提升很大,知名大模型測試博主@karminski-牙醫已經發布了一個快速測試,主要測試了編程方面的一個大象牙膏的測試項目。
結論就是肉眼可見美學, 建模, 物理模擬, 代碼性能都有提升, 甚至還有小驚喜,這個就是比之前發布的任何版本都SOTA,也就是當前最優的大模型(當然主要是指DS的版本)。
目前還不確定DeepSeek的這個新模型是不是完全體,因為有網友測試這兩天很熱門的50米距離上去洗車是走路還是開車去的問題上,DeepSeek新模型給出的回答不一,有人說正確,有人說不行。










