4月3日凌晨,谷歌旗下DeepMind团队正式发布了新一代开源模型系列Gemma 4。该系列与谷歌的旗舰模型Gemini采用同源技术,是继上一代Gemma 3发布一年后的重大版本更新。

值得注意的是,谷歌此次采用了更为开放的Apache 2.0许可证,允许开发者自由修改、分发并用于商业目的,此举显著降低了技术使用门槛。

本次发布共包含四款不同规格的模型,旨在覆盖从移动设备、边缘计算到工作站与服务器的全场景应用。其在参数效率方面表现突出,其中310亿参数版本在主流开源模型性能榜单中位列第三。

Gemma 4的四款模型分为“大模型组”与“小模型组”,各自进行了针对性优化。

大模型组中的31B Dense版本采用全激活架构,拥有310亿参数与256K上下文长度,专注于极致性能。其未量化版本可在单张80GB H100显卡上运行,量化后则能部署于消费级显卡。

另一款26B A4B MoE模型采用混合专家架构,总参数252亿但每次推理仅激活38亿,在保持接近40亿参数模型速度的同时,性能大幅超越同级模型,位列开源榜单第六,在需要低延迟的场景中性价比显著。

谷歌发布gemma 4模型系列:310亿参数版本跻身开源前三

小模型组包含E4B与E2B两款,专为终端设备设计。它们分别拥有80亿和51亿总参数,均配备128K上下文窗口。其中E2B模型的内存占用可压缩至1.5GB以下,两款小模型均集成了音频编码器,支持语音识别与翻译功能。而大模型组则专注于视觉与文本处理,未包含音频模块。

全系列模型均具备多模态理解能力,支持图像、视频输入及140多种语言。谷歌已与Pixel、高通、联发科等厂商合作进行终端优化,使得E2B/E4B模型可在手机、树莓派等设备上完全离线运行。

gemma 4小模型支持在手机等设备离线运行

与上一代Gemma 3 27B相比,Gemma 4实现了代际性能飞跃,尤其在代码生成领域进步惊人。其在Codeforces平台的评分从110大幅提升至2150,在LiveCodeBench v6测试中的正确率也从29.1%跃升至80.0%。

在数学能力上,310亿参数版本在AIME 2026竞赛测试中正确率达到89.2%,远超上代的20.8%。在综合推理方面,其在研究生级科学问答GPQA Diamond测试中的正确率从42.4%提升至84.3%,MMLU Pro测试成绩也达到85.2%。

gemma 4在代码与数学推理能力上大幅提升

此外,其视觉理解与长文本处理能力也得到显著加强。多模态推理测试MMMU Pro正确率提升至76.9%,128K长文档理解测试MRCR v2的正确率从13.5%增至66.4%。多语言测试MMMLU成绩亦达到88.4%。

性能对比显示,26B MoE模型与31B版本的差距仅在2-5个百分点之间。而小模型组中的E4B虽仅有45亿有效参数,其性能却已接近上一代270亿参数版本,体现了优异的参数效率。

gemma 4模型在多项基准测试中表现

Gemma 4还集成了一系列核心功能:全系列内置可开关的“思考链”模式,能先输出推理步骤再给出答案,提升了复杂任务的解决能力;原生支持函数调用与结构化JSON输出,便于连接外部工具。谷歌同期发布了开源开发框架ADK,以支持在终端设备上构建智能应用。

在多模态处理上,新系列支持可变分辨率图像及60秒以内视频帧分析,用户可手动调节视觉处理的资源分配,以平衡速度与精度。长文档处理则采用混合注意力机制,在优化内存占用的同时保证了处理效果。

(举报)

点赞(4)

评论列表共有 0 条评论

立即
投稿
返回
顶部