谷歌发布Gemma 4大模型：31B登顶开源第三！手机可离线运行

2026-04-11 10:20 6 阅读 0 评论 4 点赞

4月3日凌晨，谷歌旗下DeepMind团队正式发布了新一代开源模型系列Gemma 4。该系列与谷歌的旗舰模型Gemini采用同源技术，是继上一代Gemma 3发布一年后的重大版本更新。

值得注意的是，谷歌此次采用了更为开放的Apache 2.0许可证，允许开发者自由修改、分发并用于商业目的，此举显著降低了技术使用门槛。

本次发布共包含四款不同规格的模型，旨在覆盖从移动设备、边缘计算到工作站与服务器的全场景应用。其在参数效率方面表现突出，其中310亿参数版本在主流开源模型性能榜单中位列第三。

Gemma 4的四款模型分为“大模型组”与“小模型组”，各自进行了针对性优化。

大模型组中的31B Dense版本采用全激活架构，拥有310亿参数与256K上下文长度，专注于极致性能。其未量化版本可在单张80GB H100显卡上运行，量化后则能部署于消费级显卡。

另一款26B A4B MoE模型采用混合专家架构，总参数252亿但每次推理仅激活38亿，在保持接近40亿参数模型速度的同时，性能大幅超越同级模型，位列开源榜单第六，在需要低延迟的场景中性价比显著。

谷歌发布gemma 4模型系列：310亿参数版本跻身开源前三

小模型组包含E4B与E2B两款，专为终端设备设计。它们分别拥有80亿和51亿总参数，均配备128K上下文窗口。其中E2B模型的内存占用可压缩至1.5GB以下，两款小模型均集成了音频编码器，支持语音识别与翻译功能。而大模型组则专注于视觉与文本处理，未包含音频模块。

全系列模型均具备多模态理解能力，支持图像、视频输入及140多种语言。谷歌已与Pixel、高通、联发科等厂商合作进行终端优化，使得E2B/E4B模型可在手机、树莓派等设备上完全离线运行。

gemma 4小模型支持在手机等设备离线运行

与上一代Gemma 3 27B相比，Gemma 4实现了代际性能飞跃，尤其在代码生成领域进步惊人。其在Codeforces平台的评分从110大幅提升至2150，在LiveCodeBench v6测试中的正确率也从29.1%跃升至80.0%。

在数学能力上，310亿参数版本在AIME 2026竞赛测试中正确率达到89.2%，远超上代的20.8%。在综合推理方面，其在研究生级科学问答GPQA Diamond测试中的正确率从42.4%提升至84.3%，MMLU Pro测试成绩也达到85.2%。

gemma 4在代码与数学推理能力上大幅提升

此外，其视觉理解与长文本处理能力也得到显著加强。多模态推理测试MMMU Pro正确率提升至76.9%，128K长文档理解测试MRCR v2的正确率从13.5%增至66.4%。多语言测试MMMLU成绩亦达到88.4%。

性能对比显示，26B MoE模型与31B版本的差距仅在2-5个百分点之间。而小模型组中的E4B虽仅有45亿有效参数，其性能却已接近上一代270亿参数版本，体现了优异的参数效率。

gemma 4模型在多项基准测试中表现

Gemma 4还集成了一系列核心功能：全系列内置可开关的“思考链”模式，能先输出推理步骤再给出答案，提升了复杂任务的解决能力；原生支持函数调用与结构化JSON输出，便于连接外部工具。谷歌同期发布了开源开发框架ADK，以支持在终端设备上构建智能应用。

在多模态处理上，新系列支持可变分辨率图像及60秒以内视频帧分析，用户可手动调节视觉处理的资源分配，以平衡速度与精度。长文档处理则采用混合注意力机制，在优化内存占用的同时保证了处理效果。

（举报）