春節期間,備受關注的大模型領域迎來新動態。DeepSeek在未大張旗鼓宣傳的情況下,悄然推出了新版本模型,引發全網熱議。此前,眾多網友都在期待DeepSeek發布大版本更新DeepSeek V4,但從目前情況看,春節期間發布大版本的可能性不大,此次悄然更新的版本已帶來諸多亮點。
據DeepSeek官方介紹,此次更新重點提升了上下文處理能力,新版本上下文容量達到1M,而之前的DeepSeek V3系列僅為128K。這一顯著提升,讓DeepSeek具備了處理超長文本的能力。有網友通過實測證實,新版本可以一次性處理像《三體》三部曲這樣體量的文本,這在以往版本中是難以實現的。
在回答自身身份問題時,DeepSeek新模型的表現也頗為特別。它明確表示自己就是最新的DeepSeek模型,沒有特定的子名稱,既不是V3也不是R1。這種表述方式,似乎在刻意強調與以往版本的不同,但又巧妙地避免了讓人產生這是V4 Preview預覽版的聯想。
盡管DeepSeek官方未對其他方面能力提升作詳細說明,但網友的反饋卻十分積極。知名大模型測試博主@karminski - 牙醫發布了一個快速測試,測試項目為編程領域的大象牙膏項目。測試結果顯示,新模型在美學、建模、物理模擬以及代碼性能等方面均有明顯提升,甚至還帶來了一些小驚喜,堪稱當前DeepSeek版本中最優的大模型。
不過,新模型目前似乎還未達到完全穩定的狀態。有網友針對當下熱門的“50米距離上去洗車是走路還是開車去”這一問題進行測試,發現新模型給出的回答并不統一,有人得到正確答案,有人則未能得到理想結果,這也讓新模型的實際能力引發了更多討論。











