Gemma 4

模型系列

四款模型覆盖从边缘设备到数据中心的全场景需求,满足不同算力预算和性能要求。

高效 Transformer 架构

Gemma 4 E2B

20 亿参数·128K 上下文窗口

超轻量级多模态模型,专为手机和嵌入式设备打造。仅需 2GB 显存即可运行,支持文本和图像理解,是移动端 AI 应用的理想选择。

Use case: 适用场景:手机端 AI 助手、边缘设备推理、IoT 智能终端
高效 Transformer 架构

Gemma 4 E4B

40 亿参数·128K 上下文窗口

轻量高效的多模态模型,在性能与资源消耗之间取得出色平衡。支持文本、图像、视频和音频理解,可在消费级笔记本电脑上流畅运行。

Use case: 适用场景:笔记本端智能助手、内容理解与摘要、多语言翻译
混合专家架构 (128 专家)

Gemma 4 26B A4B

260 亿参数 (MoE)·256K 上下文窗口

采用混合专家 (MoE) 架构,拥有 128 个专家模块,每次推理仅激活 40 亿参数。在保持高性能的同时大幅降低推理成本,堪称效率与能力的完美结合。

Use case: 适用场景:企业级智能助手、复杂代码生成、长文档分析
Dense 全参数架构

Gemma 4 31B

310 亿参数·256K 上下文窗口

旗舰级全参数稠密模型,在各项基准测试中表现卓越。256K 超长上下文窗口可处理整本书籍或大型代码库,是追求极致性能的首选方案。

Use case: 适用场景:专业代码开发、学术研究、复杂推理与数学证明

模型对比

E2BE4B26B MoE31B Dense
参数量2B4B26B (A4B)31B
架构DenseDenseMoE (128 experts)Dense
上下文长度128K128K256K256K
模态支持Text, Image, AudioText, Image, AudioText, Image, VideoText, Image, Video, Audio

硬件推荐

根据你的设备类型选择最适合的 Gemma 4 模型,从手机到工作站均可运行。

📱

手机 / 平板

Gemma 4 E2B

💻

笔记本电脑

Gemma 4 E4B

🖥️

桌面级 GPU

Gemma 4 26B MoE

工作站 / 服务器

Gemma 4 31B Dense

VRAM Requirements

ModelBF16INT8INT4
Gemma 4 E2B4 GB2.5 GB1.5 GB
Gemma 4 E4B8 GB5 GB3 GB
Gemma 4 26B (MoE)52 GB28 GB16 GB
Gemma 4 31B (Dense)62 GB33 GB18 GB