谷歌发布超轻量开源AI模型Gemma 3 270M，可在智能手机端流畅运行-AI前沿快讯-AI工具导航

谷歌发布超轻量开源AI模型Gemma 3 270M，可在智能手机端流畅运行

8月15日消息，谷歌旗下人工智能研究团队DeepMind正式推出一款全新的开源小型语言模型：Gemma 3 270M。该模型仅含2.7亿参数，专为高效能、低资源环境设计，可在智能手机、树莓派甚至浏览器中本地运行，无需联网即可完成复杂任务。

Gemma 3 270M聚焦于“小而精”，其核心目标是实现高效率部署，尤其适用于移动端和边缘设备。据谷歌内部测试显示，该模型在Pixel 9 Pro芯片组上运行流畅，且功耗极低，进行25轮对话仅消耗手机电量的0.75%，为隐私保护、离线使用等场景提供了切实可行的技术方案。

虽然体积小巧，Gemma 3 270M在关键基准测试中表现亮眼。在衡量指令遵循能力的IFEval测试中，经指令调优的版本取得了51.2%的成绩，超越同类小型模型如SmolLM2 135M和Qwen 2.5 0.5B，接近部分十亿级模型的表现水平。

该模型采用混合架构设计，结合1.7亿嵌入层参数与1亿Transformer模块参数，在保证体型紧凑的同时提升语义理解能力。其继承自Gemma 3系列大模型的架构与预训练策略，确保了生态内的兼容性与一致性。

谷歌强调，Gemma 3 270M的设计理念是“选择合适的工具做合适的事”。它不仅适用于企业级应用，也具备广泛的应用延展性。据Google DeepMind工程师奥马尔·桑塞维耶罗（Omar Sanseviero）在社交平台X上透露，该模型已成功在智能手机、网页浏览器、树莓派，甚至被调侃为“烤面包机”级别的硬件上运行，凸显其极致轻量化特性。

为增强实用性，谷歌同步发布了预训练版与指令调优版两个版本，并提供Quantization-AwareTraining（QAT）量化检查点，支持INT4精度压缩，几乎不损失性能，适合直接投入生产环境。

开发者可通过HuggingFace、UnSloth、JAX等主流工具快速完成微调与部署，官方还提供了详细的文档、微调方案及部署指南，助力从实验到落地的无缝衔接。

谷歌指出，在诸如情感分析、实体抽取、查询路由、结构化文本生成、合规审查及创意写作等特定任务中，一个经过精细调优的小模型往往比庞大的通用模型更快、更省成本。此前案例显示，Adaptive ML公司联合SK Telecom对Gemma 3 4B模型进行多语言内容审核微调后，性能反超多个更大规模的专有系统。Gemma 3 270M将进一步降低这一门槛，让企业能够构建“专属模型舰队”，针对不同任务定制专属AI能力。

Gemma 3 270M采用Gemma定制许可协议发布，允许开发者自由使用、修改、分发模型及其衍生作品，支持商业化用途，无需额外付费授权。

随着Gemma模型家族下载量突破2亿次，产品线覆盖云端、桌面端到移动端优化版本，谷歌正致力于打造一个开放、高效、可信赖的轻量AI生态体系。此次推出的Gemma 3 270M，不仅是技术上的又一次精进，更传递出明确信号：未来的AI不应仅依赖算力堆砌，而应回归实用主义，服务于更广泛、更普惠的智能场景。

目前，Gemma 3 270M已全面开放下载，开发者可通过GoogleAI官网获取模型文件及相关资源

参考资料：https://developers.googleblog.com/en/introducing-gemma-3-270m/