GLM-5发布:智谱AI新一代旗舰模型,开源Agent的转折点,能直接生成Word/Excel

工具推荐 1770878465更新

1

智谱AI正式发布GLM-5,这是其截止目前规模最大的开源模型,参数总量达744B(活跃参数40B),预训练数据从23T提升至28.5T tokens。

GLM-5在推理、编码和Agent任务上实现了开源模型全球第一的性能表现,在Vending Bench 2上以$4432的收入位居开源模型榜首,正式对标Claude Opus 4.5。

它不仅是一个更强的聊天模型,更是一个能够直接生成可交付文档(Word/Excel/PDF)、在复杂系统中完成长周期任务的工程级工具。大模型正从“对话”向“工作”转型,GLM-5或许是这个趋势的最直接证明。

Scaling仍是提升AGI智能效率的核心路径。智谱AI在GLM-5上延续了这一路线:相比GLM-4.5的355B参数(32B活跃),GLM-5将参数总量提升至744B,活跃参数为40B,预训练数据量增加至28.5T tokens。这一规模已接近当前开源模型的极限,更重要的是,智谱AI通过集成DeepSeek 的 Sparse Attention(DSA)稀疏注意力机制,在保持长上下文能力的同时显著降低了部署成本。

RL训练效率一直是制约大模型能力突破的瓶颈。 为此,智谱AI开发了名为Slime的异步RL基础设施,大幅提升了训练吞吐量和效率,使更细粒度的后训练迭代成为可能。正是Pre-training与Post-training的双重突破,让GLM-5在学术基准测试上相对GLM-4.7实现了显著提升,并在推理、编码和Agent任务上达到全球开源模型最佳水平,进一步缩小了与前沿闭源模型的差距。

复杂系统工程和长周期Agent任务是GLM-5的核心战场。 在智谱内部评估套件CC-Bench-V2上,GLM-5在前端、后端和长周期任务上均大幅超越GLM-4.7,与Claude Opus 4.5的差距明显收窄。而在Vending Bench 2(模拟一年期自动售货机运营)上,GLM-5以$4432的收入位列开源模型第一 ,接近Claude Opus 4.5的$4967,展现出强大的长期规划和资源管理能力。

更值得关注的是,GLM-5对“工作流”的重新定义。

智谱AI提出,基础模型正在从“聊天”转向“工作”,就像Office工具之于知识工作者、编程工具之于工程师。

GLM-5能够直接将文本或源材料转化为.docx、.pdf和.xlsx文件,涵盖PRD文档、教案、试卷、电子表格、财务报告、执行脚本、菜单等,直接交付可使用的成品。官方应用Z.ai已上线Agent模式,内置PDF/Word/Excel创建技能,支持多轮协作并将输出转化为真实交付物。

GLM-5已在Hugging Face和ModelScope开源,模型权重采用MIT许可证发布。同时上线api.z.ai和BigModel.cn开发者平台,兼容Claude Code和OpenClaw。

在编程Agent领域,GLM-5已支持Claude Code、OpenCode、Kilo Code、Roo Code、Cline、Droid等多种主流开发框架。

智谱AI还支持在非NVIDIA芯片上部署GLM-5,包括华为昇腾、摩尔线程、寒昆仑、曙光等国产芯片,通过内核优化和模型量化实现合理吞吐量。


参考资料:https://z.ai/blog/glm-5