
前沿资讯
1759215506更新
0
导读:Anthropic 发布了 Claude Sonnet 4.5。本次更新在编程能力、复杂任务处理和安全性进行了全面升级。它不仅能在长时间、多步骤任务中保持稳定,还首次推出了 Claude Agent SDK,让开发者能直接搭建自己的智能代理。对于金融、法律、医学和 STEM 等领域的用户来说,性能提升尤为明显。
Anthropic 宣布上线最新版本 Claude Sonnet 4.5。相比前代产品,该版本在编程能力、推理和数学计算方面有明显提升,同时也带来了更完善的安全防护机制。
核心亮点包括:
- 在编程工具 Claude Code 中新增了“检查点”功能,方便用户随时回退历史进度。
- 推出了原生 VS Code 插件和全新终端界面。
- 在 Claude 应用中加入了代码执行和文件创建功能,用户能直接生成表格、幻灯片和文档。
- 向开发者开放了 Claude Agent SDK,这是 Anthropic 自家搭建代理时使用的底层工具,适用于更广泛的任务场景。
在性能方面,Claude Sonnet 4.5 在 SWE-bench Verified 编程基准测试中表现突出,可连续专注超过 30 小时处理复杂任务。在 OSWorld 测试中,它以 61.4% 的成绩位列前茅,而四个月前 Sonnet 4 的成绩仅为 42.2%,它在实际电脑操作和多任务处理上的能力显著增强。
除了编程能力外,金融、法律、医学及 STEM 领域的专家也证实了它在专业推理上的进步。相比此前的 Claude Opus 4.1,Sonnet 4.5 展现出更强的专业知识掌握和问题解决能力。
在安全性上,Anthropic 将 Sonnet 4.5 纳入 AI Safety Level 3 (ASL-3) 防护框架。开发团队重点改进了防御“提示注入”攻击的能力,并通过新的分类器减少潜在的危险输出。根据官方数据,相关误报率已比此前降低了十倍。
值得一提的是,Anthropic 还上线了一项临时实验功能 “Imagine with Claude”,正如昨天文章中所介绍的,Claude 会实时生成软件代码,没有预设模板,完全依赖用户的交互请求。这项实验将向 Max 用户开放五天。
目前,Claude Sonnet 4.5 已在全球范围开放,价格与 Sonnet 4 保持一致。用户可在 Claude 应用、API 及 Claude Code 中直接使用新版服务。开发者则可以借助 Claude Agent SDK 搭建属于自己的智能代理。
参考资料:https://www.anthropic.com/news/claude-sonnet-4-5