4月3日凌晨,Google DeepMind 正式發布新一代開源模型系列 Gemma4。此次更新距離上一代產品發布整整一年,谷歌不僅在性能上實現了“代際跨越”,更在開源誠意上放出了大招:將許可證由自有協議徹底更換為全球通用的 Apache2.0,這意味著開發者可以更自由地進行商用與二次開發。
規格全覆蓋:從手機端到工作站的“四劍客”Gemma4 此次一口氣推出了四款不同規格的模型,實現了全場景覆蓋:
31B Dense(旗艦版):310億全激活參數,支持256K 超長上下文。在 Arena AI 開源排行榜中高居第三,未量化版本僅需一張 H100即可運行。
26B A4B MoE(性價比之王): 采用混合專家架構,總參數252億,激活參數僅為38億。其推理速度接近4B 模型,但質量遠超同級別產品,位列排行榜第六。
E4B & E2B(端側精英): 專為手機和嵌入式設備優化。通過 Per-Layer Embeddings 技術,有效參數分別壓縮至45億和23億。其中 E2B 在部分設備上的內存占用可壓至1.5GB 以下。
性能狂飆:代碼與數學能力實現代際飛躍相比上一代 Gemma327B,Gemma4 的核心指標提升堪稱驚人:
數學競賽: AIME2026測試從20.8% 飆升至 89.2%。
編程進化: Codeforces ELO 評分從110拉升至 2150,在 LiveCodeBench 測試中從29.1% 漲至80.0%,成為目前最可用的開源編程輔助模型之一。
綜合推理: 研究生級科學問答(GPQA Diamond)得分從42.4% 幾乎翻倍至 84.3%。
多語言能力: 原生支持140多種語言,MMMLU 評分達88.4%。
核心特性:內置“思考模式”與 Agent 基因Gemma4 不僅僅是參數的增長,更在交互邏輯上向旗艦 Gemini 看齊:
Thinking Mode: 內置可開關的思考模式,模型在輸出答案前會先進行內部推理,極大提升了多步驟規劃類任務的準確性。
原生 Agent 支持: 支持函數調用和結構化 JSON 輸出。谷歌同步發布了開源 Agent 開發工具包(ADK),讓端側模型也能變身“智能體”。
深度多模態: 所有版本均支持圖像和視頻輸入,小模型版本甚至額外自帶了音頻編碼器,支持語音識別與翻譯。
行業觀察:開源賽道的“權力重組”在過去的一年里,國內開源模型(如 DeepSeek、Qwen、GLM 等)迭代極快,谷歌在開源領域的影響力一度被削弱。Gemma4 的發布,標志著谷歌正通過“極致的端側工程化”與“更徹底的協議開放”重回主戰場。
結語:當大廠開始講“誠意”
從自定義協議轉向 Apache2.0,谷歌用實際行動回答了開源誠意的問題。當31B 規模的模型能跑出接近閉源旗艦的性能,且能流暢運行在消費級顯卡甚至手機上時,全球 AI 開發者的創作邊界將再次被拓寬。










