OpenAI推出全新ChatGPT Agent模式

前沿资讯 1752806528更新

102

7月18日消息,OpenAI推出全新Agent模式,该模式赋予了ChatGPT主动决策与操作能力,能够基于用户的指令,完成从研究到执行的全流程复杂任务。

全新的ChatGPT Agent能直接代替用户完成一系列复杂任务,这些任务不再局限于文字处理,而是通过ChatGPT内置的虚拟计算机,完成包括浏览网页、运行代码、筛选结果以及生成报告、幻灯片等动作。

此次更新的核心是一套统一的智能代理系统,融合了OpenAI过去发布的“Operator”和“深度研究”两项技术。Operator能够与网页交互,如点击、浏览和输入信息,而深度研究则擅长信息分析和提炼。通过将两者结合,ChatGPT Agent突破了单一场景限制,既能与复杂网站交互搜集信息,也能生成详尽且有深度的分析报告。

此外,ChatGPT Agent还新增了一系列工具:可视化浏览器、文本浏览器、终端工具,以及连接Gmail、Github等应用的API。这种工具链的配备使得ChatGPT Agent能够动态地选择最佳路径完成任务,从高效浏览网页到精准处理数据,具备灵活适应不同需求的强大能力。

ChatGPT Agent在日常和专业场景中均表现出强大的实用性。在工作中,它可以完成数据转换、会议安排、PPT制作等任务。在生活中,它能处理旅行规划、晚宴设计、专家预约等需求。不论是生成财务模型、研究行业竞争,还是从零组织生活细节,ChatGPT Agent都能从容应对。

为了保证用户体验和任务执行的透明度,ChatGPT Agent会在执行任何重要操作前征得用户许可,用户也可随时中断任务或接管浏览器,真正实现灵活交互和高度可控。此外,通过“解说模式”,用户能实时看到ChatGPT的操作步骤,确保任务进程始终符合自己的期望。

重要的是,用户还可以通过ChatGPT的连接功能(Connectors)与外部应用无缝集成。它可以总结用户邮箱中的重要邮件、查询会议空档,或自动生成每周的报告。这一功能不仅可以提升工作效率,也为个人生活带来了极大的便利。

随着功能的进化,ChatGPT团队表示他们对安全和隐私保护也进行了强化。ChatGPT Agent采用了目前最全面的隐私保护和风险防控措施。它会默认拒绝如涉及金融转账之类的高风险任务,并在执行发送邮件等关键任务时,要求用户实时监督。此外,用户可随时删除浏览数据并退出当前会话,确保隐私保护。

ChatGPT Agent现已开放给Pro、Plus、和Team用户,Enterprise与Education用户则需等待几周。Pro用户享有400条月度消息使用限额,Plus和Team用户每月可使用40条,并可按需付费提升额度。

ChatGPT Agent的推出预示了一个AI深度赋能日常生活和专业工作的新时代。正如OpenAI所表达的展望:这仅仅是一个开始,未来将更加精彩。

参考资料:https://openai.com/index/introducing-chatgpt-agent/