智谱开源新一代旗舰模型GLM-4.5,综合评测位列全球第三、国产第一、开源第一

前沿资讯 1753755907更新

0

7月28日晚,智谱AI正式发布新一代旗舰大模型GLM-4.5,并同步在Hugging Face、ModelScope平台开源全部权重,采用MIT License。GLM-4.5首次在单一模型内原生融合推理、代码与智能体三大能力,在12项国际权威基准的综合得分中位列全球第三、国产第一,并刷新开源模型纪录。在面向真实代码智能体的人工评测中,被认定为“国内最佳”。

GLM-4.5采用混合专家(MoE)架构,总参数量3550亿,激活参数仅320亿,参数效率约为DeepSeek-R1的一半、Kimi-K2的三分之一。轻量版GLM-4.5-Air总参数1060亿,激活120亿,可覆盖不同部署场景。

模型提供“思考模式”与“非思考模式”双档运行。思考模式专注复杂推理与多工具调用,非思考模式则保证毫秒级响应,满足高并发需求。实测高速版最高可达100 tokens/秒。

GLM-4.5系列API已上线智谱开放平台BigModel.cn,调用价格仅为输入0.8元/百万tokens、输出2元/百万tokens,显著低于主流商用模型。开发者可一键接入Claude Code等框架,实现“零改造”迁移。

为验证真实场景表现,智谱设计并公开了52道编程开发任务,用于真实代码智能体场景评估,覆盖前端、后端、数据库、游戏、算法、运维六大领域。在容器化多轮交互测试中,GLM-4.5在任务完成度、工具调用可靠性两项关键指标上领先所有开源模型,整体表现逼近Claude-4-Sonnet。

GLM-4.5原生支持前端页面、后端服务、数据库管理与任意工具调用,可独立完成复杂应用、游戏、交互网页的全栈开发。用户只需给出主题,模型即可自主检索资料、匹配配图,并以HTML形式输出16:9 PPT、长图、小红书封面、社交媒体海报或简历等多比例作品。

GLM-4.5系列首先完成15万亿token通用预训练,再追加7万亿token代码与推理专项训练,最后通过强化学习(RL)阶段针对性提升推理、代码与智能体能力。智谱自研的RL基础设施“slime”亦一并开源,具备同步/异步混合训练、混合精度加速、长程任务并行等特性,支持社区二次开发。

使用与体验:

•开发者:登录BigModel.cn,可即刻调用API并兼容Claude Code、Cline、Roo Code等主流代码智能体框架。

•普通用户:智谱清言(chatglm.cn)与z.ai已上线“满血版”GLM-4.5,可在线免费体验。

•模型权重与代码:Hugging Face、ModelScope搜索“GLM-4.5”即可下载。

智谱CEO张鹏表示:“GLM-4.5是我们在AGI路径上的关键里程碑。我们相信,开源、高效、低成本的模型将加速智能体时代的真正到来。”

北京智谱华章科技有限公司(简称“智谱”)成立于2019年,专注于大模型研发与AGI探索。旗下GLM系列模型累计下载量超2000万,服务全球70余国家和地区。

参考资料:https://z.ai/blog/glm-4.5;GLM-4.5发布:面向推理、代码与智能体的开源SOTA模型