格隆匯2月13日|據新智元,谷歌Gemini 3 Deep Think原地進化!在Codeforces比賽中拿下全球第七,擊敗了人類選手。短短三個月,全方位刷爆SOTA。今天,Gemini 3 Deep Think重磅升級,幾乎刷爆全領域的SOTA,標志著AI推理能力進入了全新維度。
離職Anthropic入職谷歌的華人學者姚順宇參與了Gemini 3 Deep Think這一次,在科學研究和硬核工程領域,Deep Think堪稱一個「最強大腦」。它可以將草圖渲染成一個高保真、實用的3D筆記本電腦支架圖,并直接將其打印出來。
新版Deep Think的實力究竟有多恐怖?在編程界,它刷出了3455 Elo的驚人分數,達到世界冠軍級的水準,沖入了Codeforces比賽人類TOP 10!也就是說,全球只有7人擊敗了Gemini 3 Deep Think,一年前,最強o3也僅拿下2727 Elo。
在人類最后考試(HLE)上,Gemini 3 Deep Think刷新SOTA,拿下了48.4%的成績。甚至,它在一夜之間讓最難的ARC-AGI-2基準直接飽和,以84.6%新SOTA一騎絕塵。與Gemini 3 Pro相比,Deep Think實現了全方位反超,并將Claude Opus 4.6、GTP-5.2直接踩在了腳下。
離職Anthropic入職谷歌的華人學者姚順宇參與了Gemini 3 Deep Think這一次,在科學研究和硬核工程領域,Deep Think堪稱一個「最強大腦」。它可以將草圖渲染成一個高保真、實用的3D筆記本電腦支架圖,并直接將其打印出來。
新版Deep Think的實力究竟有多恐怖?在編程界,它刷出了3455 Elo的驚人分數,達到世界冠軍級的水準,沖入了Codeforces比賽人類TOP 10!也就是說,全球只有7人擊敗了Gemini 3 Deep Think,一年前,最強o3也僅拿下2727 Elo。
在人類最后考試(HLE)上,Gemini 3 Deep Think刷新SOTA,拿下了48.4%的成績。甚至,它在一夜之間讓最難的ARC-AGI-2基準直接飽和,以84.6%新SOTA一騎絕塵。與Gemini 3 Pro相比,Deep Think實現了全方位反超,并將Claude Opus 4.6、GTP-5.2直接踩在了腳下。











