模型系列
四款模型覆盖从边缘设备到数据中心的全场景需求,满足不同算力预算和性能要求。
Gemma 4 E2B
20 亿参数 · 128K 上下文窗口
超轻量级多模态模型,专为手机和嵌入式设备打造。仅需 2GB 显存即可运行,支持文本和图像理解,是移动端 AI 应用的理想选择。
Gemma 4 E4B
40 亿参数 · 128K 上下文窗口
轻量高效的多模态模型,在性能与资源消耗之间取得出色平衡。支持文本、图像、视频和音频理解,可在消费级笔记本电脑上流畅运行。
Gemma 4 26B A4B
260 亿参数 (MoE) · 256K 上下文窗口
采用混合专家 (MoE) 架构,拥有 128 个专家模块,每次推理仅激活 40 亿参数。在保持高性能的同时大幅降低推理成本,堪称效率与能力的完美结合。
Gemma 4 31B
310 亿参数 · 256K 上下文窗口
旗舰级全参数稠密模型,在各项基准测试中表现卓越。256K 超长上下文窗口可处理整本书籍或大型代码库,是追求极致性能的首选方案。
核心能力
Gemma 4 在多项关键能力上实现了显著突破,为开发者提供强大的 AI 基础能力。
多模态理解
原生支持文本、图像、视频和音频输入,无需额外插件即可理解和推理多种模态内容,实现真正的跨模态 AI 应用。
超长上下文
最高支持 256K token 上下文窗口,轻松处理长篇论文、完整代码仓库或数小时的会议记录,无需分块处理即可全局理解。
智能体能力
内置函数调用和结构化 JSON 输出支持,可与外部工具和 API 无缝集成,构建具备自主决策和任务执行能力的 AI 智能体。
代码生成
在 LiveCodeBench v6 上取得 80% 的优异成绩,支持代码生成、调试、重构和解释,覆盖主流编程语言,是开发者的得力编程助手。
多语言支持
支持超过 140 种语言的理解和生成,涵盖中文、英文、日文、韩文、阿拉伯文等主流语言,助力全球化产品和多语言应用。
高级推理
在 AIME 2026 数学竞赛中取得 89.2% 的顶尖成绩,具备复杂逻辑推理、数学证明和多步问题求解能力,可胜任高难度学术任务。
基准测试
Gemma 4 在多项权威基准测试中表现卓越,与顶级闭源模型不相上下。
AIME 2026
美国数学邀请赛基准,评测模型的高级数学推理与问题求解能力。
LiveCodeBench v6
实时编程基准测试,评测模型在真实编程任务中的代码生成与调试能力。
GPQA Diamond
研究生级别的问答基准,涵盖物理、化学、生物等学科的专家级难题。
MMMLU
多语言大规模多任务语言理解基准,评测模型在各语种上的知识广度与理解深度。