Claude Code新推出Fast Mode,响应速度提2.5倍,成本飙到6倍

前沿资讯 1770542289更新

0

导读:Claude Code 刚刚推出了一个名为「Fast Mode」的新功能。 开启后,可以获得更快的响应速度,但代价是更高的 token 费用。官方还给出了 50% 的限时折扣,截止到 2 月 16 日。


Fast Mode,把响应速度的优先级放到了成本之前,Claude 会以更快的速度回复,但代价是每处理一个 token 要花更多的钱。

根据官方信息,Fast Mode 的定价为输入 token 每百万 token 30 美元,输出 token 每百万 token 150 美元(上下文小于 20 万 token 时)。如果上下文超过 20 万 token,价格还会进一步上涨到输入 60 美元、输出 225 美元(参考标准 Opus 4.6:5美元/百万输入 token,25美元/百万输出 token)。不过有一个好消息:在 2 月 16 日晚上 11 点 59 分太平洋时间之前,所有用户都可以享受 5 折优惠

什么时候该打开 Fast Mode?

官方建议是:Fast Mode 适合那些响应延迟比成本更重要的场景,比如,需要快速迭代代码修改的情况、实时调试会话、以及 deadline 逼近的紧急任务。在这些场景下,多花点钱换取更快的反馈更值当。

反过来,如果你正在处理长时间的自治任务、批量处理工作或者 CI/CD 管道里的任务,那标准模式仍然是更好的选择。 因为在这些场景下,你不需要实时看到每一步的响应。另外,那些对成本特别敏感的工作负载也不必急于开启 Fast Mode。

这里有个细节值得注意:Fast Mode 和 effort level(努力程度)都可以影响响应速度,但原理不同。Fast Mode 是在保持质量的前提下降低延迟,而降低 effort level 则是减少思考时间以换取更快响应,代价是复杂任务的质量可能下降。两者可以叠加使用,在处理简单任务时追求极致速度。

开启 Fast Mode 的方法非常简单:在 Claude Code CLI 中输入 /fast 并按 Tab 键,或者在 VS Code 扩展里同样使用 /fast 命令。 你也可以在用户设置文件中把 "fastMode": true 写进去,这样 Fast Mode 会跨会话保持开启状态。

开启后,你会看到一个确认消息「Fast Mode ON」,而且在提示符旁边会出现一个 ↯ 图标,表示 Fast Mode 正在运行。如果你想检查当前状态,随时再次输入 /fast 就可以了。需要提醒的是,关闭 Fast Mode 后你仍然会停留在 Opus 4.6 模型上,系统不会自动切回你之前用的模型。 如果需要切换到其他模型,要使用 /model 命令。

另外一个小技巧是:为了成本最优,建议在会话一开始就开启 Fast Mode,而不是在对话中间切换。 因为如果在对话中间才开启,你需要为整个对话上下文支付完整的 Fast Mode 缓存前输入 token 价格,这比一开始就开启要花更多钱。

有几个重要的限制条件需要了解清楚。

首先,Fast Mode 目前不能在第三方云平台上使用,包括 Amazon Bedrock、Google Vertex AI 和 Microsoft Azure Foundry。你只能通过 Anthropic Console API 或者拥有订阅计划(Pro/Max/Team/Enterprise)的账户来使用。

其次,Fast Mode 是按「额外使用量」计费的,即使你的订阅计划还有剩余额度也不例外。Fast Mode 消耗的 token 不会计入你计划内的使用量,而是直接从额外使用量里扣除,按 Fast Mode 的费率从第一个 token 开始计费。对于个人账户,可以在 Console 账单设置里启用额外使用量。

关于速率限制,Fast Mode 有独立于标准 Opus 4.6 的速率限制。当你触发了 Fast Mode 的速率限制或者用完了额外使用量额度时,系统会自动回退到标准 Opus 4.6 模式,↯ 图标会变成灰色表示正在冷却。冷却期间你会继续以标准速度和标准价格工作,等冷却结束后 Fast Mode 会自动重新启用。如果你不想等,手动再次输入 /fast 就可以关闭。

官方明确表示,Fast Mode 目前处于「研究预览」阶段,功能可能会根据用户反馈进行调整,可用性和定价都可能有变化,底层 API 配置也可能会演进。


参考资料:https://code.claude.com/docs/en/fast-mode;https://x.com/xiaohu/status/2020337655771513306