Apache 2.0 Open Source

Gemma 4 开源模型家族

Google DeepMind 最新一代开源 AI 模型，支持文本、图像、视频、音频多模态理解，最高 256K 上下文窗口，覆盖从手机到工作站的全场景部署。Apache 2.0 许可证，支持 140+ 语言。

立即体验查看模型

模型系列

四款模型覆盖从边缘设备到数据中心的全场景需求，满足不同算力预算和性能要求。

高效 Transformer 架构

Gemma 4 E2B

20 亿参数 · 128K 上下文窗口

超轻量级多模态模型，专为手机和嵌入式设备打造。仅需 2GB 显存即可运行，支持文本和图像理解，是移动端 AI 应用的理想选择。

高效 Transformer 架构

Gemma 4 E4B

40 亿参数 · 128K 上下文窗口

轻量高效的多模态模型，在性能与资源消耗之间取得出色平衡。支持文本、图像、视频和音频理解，可在消费级笔记本电脑上流畅运行。

混合专家架构 (128 专家)

Gemma 4 26B A4B

260 亿参数 (MoE) · 256K 上下文窗口

采用混合专家 (MoE) 架构，拥有 128 个专家模块，每次推理仅激活 40 亿参数。在保持高性能的同时大幅降低推理成本，堪称效率与能力的完美结合。

Dense 全参数架构

Gemma 4 31B

310 亿参数 · 256K 上下文窗口

旗舰级全参数稠密模型，在各项基准测试中表现卓越。256K 超长上下文窗口可处理整本书籍或大型代码库，是追求极致性能的首选方案。

核心能力

Gemma 4 在多项关键能力上实现了显著突破，为开发者提供强大的 AI 基础能力。

🎨

多模态理解

原生支持文本、图像、视频和音频输入，无需额外插件即可理解和推理多种模态内容，实现真正的跨模态 AI 应用。

📄

超长上下文

最高支持 256K token 上下文窗口，轻松处理长篇论文、完整代码仓库或数小时的会议记录，无需分块处理即可全局理解。

🤖

智能体能力

内置函数调用和结构化 JSON 输出支持，可与外部工具和 API 无缝集成，构建具备自主决策和任务执行能力的 AI 智能体。

💻

代码生成

在 LiveCodeBench v6 上取得 80% 的优异成绩，支持代码生成、调试、重构和解释，覆盖主流编程语言，是开发者的得力编程助手。

🌍

多语言支持

支持超过 140 种语言的理解和生成，涵盖中文、英文、日文、韩文、阿拉伯文等主流语言，助力全球化产品和多语言应用。

🧠

高级推理

在 AIME 2026 数学竞赛中取得 89.2% 的顶尖成绩，具备复杂逻辑推理、数学证明和多步问题求解能力，可胜任高难度学术任务。

基准测试

Gemma 4 在多项权威基准测试中表现卓越，与顶级闭源模型不相上下。

89.2%

AIME 2026

美国数学邀请赛基准，评测模型的高级数学推理与问题求解能力。

80%

LiveCodeBench v6

实时编程基准测试，评测模型在真实编程任务中的代码生成与调试能力。

84.3%

GPQA Diamond

研究生级别的问答基准，涵盖物理、化学、生物等学科的专家级难题。

85.2%

MMMLU

多语言大规模多任务语言理解基准，评测模型在各语种上的知识广度与理解深度。

Gemma 4 开源模型家族

立即体验查看模型