谷歌发布超轻量开源AI模型Gemma 3 270M,可在智能手机端流畅运行

前沿资讯 1755253213更新

0

8月15日消息,谷歌旗下人工智能研究团队DeepMind正式推出一款全新的开源小型语言模型:Gemma 3 270M。该模型仅含2.7亿参数,专为高效能、低资源环境设计,可在智能手机、树莓派甚至浏览器中本地运行,无需联网即可完成复杂任务。

Gemma 3 270M聚焦于“小而精”,其核心目标是实现高效率部署,尤其适用于移动端和边缘设备。据谷歌内部测试显示,该模型在Pixel 9 Pro芯片组上运行流畅,且功耗极低,进行25轮对话仅消耗手机电量的0.75%,为隐私保护、离线使用等场景提供了切实可行的技术方案。

虽然体积小巧,Gemma 3 270M在关键基准测试中表现亮眼。在衡量指令遵循能力的IFEval测试中,经指令调优的版本取得了51.2%的成绩,超越同类小型模型如SmolLM2 135M和Qwen 2.5 0.5B,接近部分十亿级模型的表现水平。

该模型采用混合架构设计,结合1.7亿嵌入层参数与1亿Transformer模块参数,在保证体型紧凑的同时提升语义理解能力。其继承自Gemma 3系列大模型的架构与预训练策略,确保了生态内的兼容性与一致性。

谷歌强调,Gemma 3 270M的设计理念是“选择合适的工具做合适的事”。它不仅适用于企业级应用,也具备广泛的应用延展性。据Google DeepMind工程师奥马尔·桑塞维耶罗(Omar Sanseviero)在社交平台X上透露,该模型已成功在智能手机、网页浏览器、树莓派,甚至被调侃为“烤面包机”级别的硬件上运行,凸显其极致轻量化特性。

为增强实用性,谷歌同步发布了预训练版与指令调优版两个版本,并提供Quantization-AwareTraining(QAT)量化检查点,支持INT4精度压缩,几乎不损失性能,适合直接投入生产环境。

开发者可通过HuggingFace、UnSloth、JAX等主流工具快速完成微调与部署,官方还提供了详细的文档、微调方案及部署指南,助力从实验到落地的无缝衔接。

谷歌指出,在诸如情感分析、实体抽取、查询路由、结构化文本生成、合规审查及创意写作等特定任务中,一个经过精细调优的小模型往往比庞大的通用模型更快、更省成本。此前案例显示,Adaptive ML公司联合SK Telecom对Gemma 3 4B模型进行多语言内容审核微调后,性能反超多个更大规模的专有系统。Gemma 3 270M将进一步降低这一门槛,让企业能够构建“专属模型舰队”,针对不同任务定制专属AI能力。

Gemma 3 270M采用Gemma定制许可协议发布,允许开发者自由使用、修改、分发模型及其衍生作品,支持商业化用途,无需额外付费授权。

随着Gemma模型家族下载量突破2亿次,产品线覆盖云端、桌面端到移动端优化版本,谷歌正致力于打造一个开放、高效、可信赖的轻量AI生态体系。此次推出的Gemma 3 270M,不仅是技术上的又一次精进,更传递出明确信号:未来的AI不应仅依赖算力堆砌,而应回归实用主义,服务于更广泛、更普惠的智能场景。

目前,Gemma 3 270M已全面开放下载,开发者可通过GoogleAI官网获取模型文件及相关资源

参考资料:https://developers.googleblog.com/en/introducing-gemma-3-270m/