
前沿资讯
1743158716更新
2
开源的模型上下文协议(Model Context Protocol,MCP)自推出以来,致力于解决智能体在与现实世界工具交互时面临的难题。由于不同应用程序之间缺乏统一的“语言”,智能体的交互效率和功能拓展受到限制。此次更新的MCP规范,在多个关键方面进行了升级。
在协议层面,新增的OAuth 2.1-基于授权框架,为智能体与服务器之间的通信安全提供了有力保障,尤其是在基于HTTP的传输场景中,大幅提升了数据传输的安全性。可流化的HTTP传输取代了旧有的HTTP+SSE设置,实现了实时双向数据流,不仅优化了数据传输的时效性,还增强了兼容性。JSON-RPC批量处理功能能够让客户端一次性发送多个请求,显著提高了智能体与工具交互的效率,有效降低了延迟。而工具注释功能的加入,为描述工具行为增添了丰富的元数据,使智能体在工具的发现和推理上更具创造性。
基于Chrome辅助功能树,Claude能够以人类可读的形式访问和描述页面内容。其拥有的工具集涵盖了导航(如browser_navigate实现浏览器导航、go_back返回上一页、go_forward前进到下一页)、输入(包括browser_type输入内容、browser_click点击操作、browser_press_key模拟按键)、快照(browser_snapshot获取浏览器快照、browser_screenshot进行截图)以及基于辅助功能描述符的元素交互等功能。用户只需在claude_desktop_config.json中简单添加Playwright作为命令,Claude桌面应用程序就能在运行时识别并使用这些工具,这一便捷的设置可以让智能体可以轻松转变为测试自动化机器人、质量保证助手或数据导航器。
MCP采用模块化的JSON-RPC 2.0基础架构和分层架构,将核心传输、生命周期管理、服务器功能(如资源和提示)和客户端功能(如采样或日志记录)清晰分离。这种设计赋予了开发者极大的灵活性,他们可以根据具体的使用场景,有针对性地选择和实现所需的组件。
值得一提的是,OpenAI宣布在其产品中全面支持MCP。OpenAI首席执行官萨姆·奥特曼表示,目前OpenAI的智能体软件开发工具包(Agents SDK)已率先支持MCP,ChatGPT桌面应用程序和响应API也将在不久后跟进。微软同样在更新发布之际宣布支持MCP,并推出了Playwright-MCP服务器。这一服务器将微软强大的浏览器自动化工具融入MCP标准,让像Claude这样的智能体具备了更强的网络交互能力。
此前,人们一直对OpenAI和微软等行业巨头的态度存疑,如今这两家公司的支持,表明MCP在企业和开源社区中的影响力正不断扩大。随着OpenAI的API格式和MCP都获得广泛支持,标准化进程在过去几周取得了重大进展。人工智能初创公司Pleias的联合创始人亚历山大·多里亚在推特上表示:“我们正在进入人工智能的协议时代。这将是智能体真正开展工作的方式。”
随着MCP 0.2版本的发布和微软的实际支持,新一代能够在整个技术栈中安全、灵活地思考和行动的智能体的发展基础已初步奠定。但目前仍存在一个关键问题:其他行业巨头,如Meta、亚马逊或苹果等公司是否会跟进支持MCP?如果这些公司也加入支持行列,MCP极有可能成为人工智能行动的通用“语言”,推动人工智能互操作性迈向新的高度,为人工智能领域带来更为广阔的发展前景。
参考资料:https://venturebeat.com/ai/the-open-source-model-context-protocol-was-just-updated-heres-why-its-a-big-deal/