智谱GLM-4.6发布:国产AI编码能力再上新高,支持国产芯片本地运行

前沿资讯 1759223200更新

0

导读: 智谱旗舰模型GLM-4.6正式上线,成为国产最强的编码AI,代码能力较上一代提升27%。新模型不仅在真实编程和长上下文处理上表现出色,还首次实现了在国产芯片上的高效本地化运行。重点内容:国产编码能力领先、长上下文支持、推理与工具调用升级、芯片适配。


智谱正式推出GLM系列最新版本:GLM-4.6,这是国内已知最强的编码AI模型。在真实编程、长上下文处理、推理能力、信息搜索、写作能力以及智能体应用等多个维度,GLM-4.6都实现了全面升级,相较上一代GLM-4.5,代码能力提升27%。

核心升级亮点

  • 高级编码能力:在公开基准和真实编程任务中,GLM-4.6的表现已对齐Claude Sonnet 4,成为国产模型新标杆。
  • 超长上下文支持:上下文窗口从128K扩大到200K,更适合处理大型代码和复杂智能体任务。
  • 推理能力升级:不仅推理更准确,还能在推理过程中调用工具,提升实用性。
  • 搜索与工具调用增强:在智能体框架中表现更优。
  • 写作与交互优化:文风更自然,可读性和角色扮演场景更贴近人类偏好。

GLM-4.6已上线智谱MaaS平台(bigmodel.cn),并计划在Hugging Face、ModelScope开源,遵循MIT协议。

Coding能力创国产新高

8大权威基准评测(包括AIME 25、LCB v6、HLE、SWE-Bench Verified等)中,GLM-4.6部分榜单表现对齐Claude Sonnet 4/4.5,稳居国产模型首位。

真实编程评测中,GLM-4.6在Claude Code环境下完成74个真实任务,实测表现超过Claude Sonnet 4,同时在平均token消耗上比GLM-4.5节省30%以上,为同类模型最低。智谱还公开了全部测试题目与Agent轨迹,保证透明性和可复现性(链接:https://huggingface.co/datasets/zai-org/CC-Bench-trajectories)。

国产芯片适配,首创FP8+Int4部署

GLM-4.6已在寒武纪国产芯片实现FP8+Int4混合量化部署,这是国内首次实现FP8+Int4模型芯片一体化解决方案,在保证精度的前提下显著降低推理成本。

此外,基于vLLM推理框架,摩尔线程新一代GPU也可通过原生FP8精度稳定运行GLM-4.6,充分验证了MUSA架构和全功能GPU在生态兼容和快速支持上的优势。

未来,GLM-4.6与国产芯片的组合,将通过智谱MaaS平台面向大众和企业,推动训练和推理环节的性能与效率提升。

Coding Plan全面升级

随着GLM-4.6发布,智谱同步升级GLM Coding Plan,最低20元包月即可体验。企业用户还可选择企业版套餐,兼顾安全、成本和国际顶尖性能。

  • 包月用户自动升级至GLM-4.6。
  • 新增图像识别与搜索能力。
  • 支持Claude Code、Roo Code、Kilo Code、Cline等10+主流工具。
  • 面向高频开发者提供GLM Coding Max,容量为Claude Max计划的三倍。

智谱MaaS平台(bigmodel.cn、z.ai、智谱清言)已全面支持GLM-4.6,海外用户可通过z.ai使用API,同时开源部署将发布在Hugging Face和ModelScope。


参考资料:https://mp.weixin.qq.com/s/Oacd6rMM3Rmn7k18HTjLrw