Gemma 4
Apache 2.0 Open Source

Gemma 4 开源模型家族

Google DeepMind 最新一代开源 AI 模型,支持文本、图像、视频、音频多模态理解,最高 256K 上下文窗口,覆盖从手机到工作站的全场景部署。Apache 2.0 许可证,支持 140+ 语言。

模型系列

四款模型覆盖从边缘设备到数据中心的全场景需求,满足不同算力预算和性能要求。

高效 Transformer 架构

Gemma 4 E2B

20 亿参数 · 128K 上下文窗口

超轻量级多模态模型,专为手机和嵌入式设备打造。仅需 2GB 显存即可运行,支持文本和图像理解,是移动端 AI 应用的理想选择。

高效 Transformer 架构

Gemma 4 E4B

40 亿参数 · 128K 上下文窗口

轻量高效的多模态模型,在性能与资源消耗之间取得出色平衡。支持文本、图像、视频和音频理解,可在消费级笔记本电脑上流畅运行。

混合专家架构 (128 专家)

Gemma 4 26B A4B

260 亿参数 (MoE) · 256K 上下文窗口

采用混合专家 (MoE) 架构,拥有 128 个专家模块,每次推理仅激活 40 亿参数。在保持高性能的同时大幅降低推理成本,堪称效率与能力的完美结合。

Dense 全参数架构

Gemma 4 31B

310 亿参数 · 256K 上下文窗口

旗舰级全参数稠密模型,在各项基准测试中表现卓越。256K 超长上下文窗口可处理整本书籍或大型代码库,是追求极致性能的首选方案。

核心能力

Gemma 4 在多项关键能力上实现了显著突破,为开发者提供强大的 AI 基础能力。

🎨

多模态理解

原生支持文本、图像、视频和音频输入,无需额外插件即可理解和推理多种模态内容,实现真正的跨模态 AI 应用。

📄

超长上下文

最高支持 256K token 上下文窗口,轻松处理长篇论文、完整代码仓库或数小时的会议记录,无需分块处理即可全局理解。

🤖

智能体能力

内置函数调用和结构化 JSON 输出支持,可与外部工具和 API 无缝集成,构建具备自主决策和任务执行能力的 AI 智能体。

💻

代码生成

在 LiveCodeBench v6 上取得 80% 的优异成绩,支持代码生成、调试、重构和解释,覆盖主流编程语言,是开发者的得力编程助手。

🌍

多语言支持

支持超过 140 种语言的理解和生成,涵盖中文、英文、日文、韩文、阿拉伯文等主流语言,助力全球化产品和多语言应用。

🧠

高级推理

在 AIME 2026 数学竞赛中取得 89.2% 的顶尖成绩,具备复杂逻辑推理、数学证明和多步问题求解能力,可胜任高难度学术任务。

基准测试

Gemma 4 在多项权威基准测试中表现卓越,与顶级闭源模型不相上下。

89.2%

AIME 2026

美国数学邀请赛基准,评测模型的高级数学推理与问题求解能力。

80%

LiveCodeBench v6

实时编程基准测试,评测模型在真实编程任务中的代码生成与调试能力。

84.3%

GPQA Diamond

研究生级别的问答基准,涵盖物理、化学、生物等学科的专家级难题。

85.2%

MMMLU

多语言大规模多任务语言理解基准,评测模型在各语种上的知识广度与理解深度。

Gemma 4 开源模型家族

Google DeepMind 最新一代开源 AI 模型,支持文本、图像、视频、音频多模态理解,最高 256K 上下文窗口,覆盖从手机到工作站的全场景部署。Apache 2.0 许可证,支持 140+ 语言。