前沿资讯
1760266066更新
0
导读:谷歌最新研究带来了一个名为 ReasoningBank 的新系统,能理解“错在哪、为什么错”,再配合 MaTTS(记忆感知推理扩展机制),在无需重新训练的情况下,让AI任务成功率提升了34%,交互次数减少16%。
过去的AI系统,它们只会记录执行日志,能看得到哪里出错,却学不到经验。
ReasoningBank 的做法彻底不同。当智能体(Agent)在某个任务中失败,它不会只留下第几步出错的信息,而是会写下:“采用的思路A失败,原因是忽略了条件B”。下一次遇到类似情况,它会主动参考这份“反思笔记”。
ReasoningBank 存储的内容结构也相当人性化:标题 → 描述 → 具体内容。比如一条笔记可能是:
“在提取个人数据时优先考虑账户信息部分。”
这样一条抽象规则,可以迁移到上百个任务中,从网页管理到代码自动化都适用。研究团队称,这是一种“策略抽象的记忆”,不是机械复盘,而是经验的升维。
接下来登场的是配套系统 MaTTS(Memory-Aware Test-Time Scaling)。 它的理念很简单:不是扩大参数,而是扩大“经验”。
每当AI在执行新任务时,MaTTS会对比过往的推理路径,进行自我对照和动态调整。 这种机制包含两种模式:
- 并行扩展(Parallel Scaling):AI在多条路径上同时尝试并互相比对。
- 顺序扩展(Sequential Scaling):AI在运行中对自己的思考过程提出质疑和修正。
两者结合,推动了一种更贴近人类思考的“探索式对比学习”。
实验结果显示:结合 ReasoningBank 与 MaTTS 后,AI任务成功率提升了34%,交互次数减少了16%,而传统的测试时扩展(Test-Time Scaling)几乎没有改善。
更有意思的是,这套系统展现出类似人类思维演化的过程: 从最初的程序式反应(“点击这个按钮”), 到反思式检查(“确认标识符是否匹配”), 再到抽象策略(“交叉验证数据后再执行”)。
这已不只是性能优化,更像是一种认知的萌芽。
谷歌这次的研究,真正触动了AI发展的根本性问题:我们或许不该再一味“做得更大”,而该让AI学得更聪明。ReasoningBank 和 MaTTS 的结合,展示了一个新的方向:让机器像人一样,记得错、学会想、不断进化。
论文链接:https://arxiv.org/abs/2509.25140
参考资料:https://x.com/alex_prompter/status/1976996246683631972
豫公网安备41010702003375号