谷歌向AI Ultra用户开放Gemini“深度思考”模式,AI数学能力再获突破

前沿资讯 1754116259更新

0

8月2日消息,谷歌宣布,即日起向所有 Google AI Ultra订阅用户在Gemini App内推出“深度思考(Deep Think)”功能。该功能基于刚刚在国际数学奥林匹克(IMO)斩获金牌标准的Gemini 2.5 Deep Think模型精简而成,新版推理速度显著提升,更适合日常使用,而且,该精简版本在谷歌内部测试中仍可达到2025年IMO基准的铜牌水平,可在移动端实现日常可用。

据谷歌官方介绍,“深度思考”通过延长推理链并引入并行思考机制,使模型可同时生成多条解题路径,并在内部反复验证、修正,最终输出更具创造性的答案。配合新研发的强化学习算法,系统会在“思考”过程中主动选择最优推理路径,从而提升复杂问题的解决效率。

实测案例显示,该模式在以下场景表现尤为突出:

迭代式开发与设计:可逐步改进网页前端代码,兼顾美感与功能;

数学与科学发现:辅助研究人员提出并验证数学猜想,梳理复杂文献;

算法与编程:在LiveCodeBench V6等权威代码评测中展现领先水平,并在跨学科测试Humanity’s Last Exam中取得最佳成绩。

谷歌表示,相较Gemini 2.5 Pro,“深度思考”在内容安全与语气客观性上均有提升,但出现“过度拒答”的比例略高。公司正通过前沿安全评估与分级缓解机制,持续监控随着推理复杂度提升而带来的潜在风险。详细安全报告已随模型卡同步发布。

订阅Google AI Ultra的用户,在Gemini App中将模型切换至2.5 Pro,即可在输入框激活“深度思考”开关,每日可使用固定次数。该模式已自动集成代码执行与Google Search工具,支持更长输出。未来数周,谷歌还将通过Gemini API向可信开发者与企业测试者开放“深度思考”有/无工具版本,以收集更多使用反馈。

参考资料:https://blog.google/products/gemini/gemini-2-5-deep-think/