开源MCP迎升级，获OpenAI和微软支持，智能体互操作性迎来重大突破-AI前沿快讯-AI工具导航

开源MCP迎升级，获OpenAI和微软支持，智能体互操作性迎来重大突破

开源的模型上下文协议（Model Context Protocol，MCP）自推出以来，致力于解决智能体在与现实世界工具交互时面临的难题。由于不同应用程序之间缺乏统一的“语言”，智能体的交互效率和功能拓展受到限制。此次更新的MCP规范，在多个关键方面进行了升级。

在协议层面，新增的OAuth 2.1-基于授权框架，为智能体与服务器之间的通信安全提供了有力保障，尤其是在基于HTTP的传输场景中，大幅提升了数据传输的安全性。可流化的HTTP传输取代了旧有的HTTP+SSE设置，实现了实时双向数据流，不仅优化了数据传输的时效性，还增强了兼容性。JSON-RPC批量处理功能能够让客户端一次性发送多个请求，显著提高了智能体与工具交互的效率，有效降低了延迟。而工具注释功能的加入，为描述工具行为增添了丰富的元数据，使智能体在工具的发现和推理上更具创造性。

基于Chrome辅助功能树，Claude能够以人类可读的形式访问和描述页面内容。其拥有的工具集涵盖了导航（如browser_navigate实现浏览器导航、go_back返回上一页、go_forward前进到下一页）、输入（包括browser_type输入内容、browser_click点击操作、browser_press_key模拟按键）、快照（browser_snapshot获取浏览器快照、browser_screenshot进行截图）以及基于辅助功能描述符的元素交互等功能。用户只需在claude_desktop_config.json中简单添加Playwright作为命令，Claude桌面应用程序就能在运行时识别并使用这些工具，这一便捷的设置可以让智能体可以轻松转变为测试自动化机器人、质量保证助手或数据导航器。

MCP采用模块化的JSON-RPC 2.0基础架构和分层架构，将核心传输、生命周期管理、服务器功能（如资源和提示）和客户端功能（如采样或日志记录）清晰分离。这种设计赋予了开发者极大的灵活性，他们可以根据具体的使用场景，有针对性地选择和实现所需的组件。

值得一提的是，OpenAI宣布在其产品中全面支持MCP。OpenAI首席执行官萨姆·奥特曼表示，目前OpenAI的智能体软件开发工具包（Agents SDK）已率先支持MCP，ChatGPT桌面应用程序和响应API也将在不久后跟进。微软同样在更新发布之际宣布支持MCP，并推出了Playwright-MCP服务器。这一服务器将微软强大的浏览器自动化工具融入MCP标准，让像Claude这样的智能体具备了更强的网络交互能力。

此前，人们一直对OpenAI和微软等行业巨头的态度存疑，如今这两家公司的支持，表明MCP在企业和开源社区中的影响力正不断扩大。随着OpenAI的API格式和MCP都获得广泛支持，标准化进程在过去几周取得了重大进展。人工智能初创公司Pleias的联合创始人亚历山大·多里亚在推特上表示：“我们正在进入人工智能的协议时代。这将是智能体真正开展工作的方式。”

随着MCP 0.2版本的发布和微软的实际支持，新一代能够在整个技术栈中安全、灵活地思考和行动的智能体的发展基础已初步奠定。但目前仍存在一个关键问题：其他行业巨头，如Meta、亚马逊或苹果等公司是否会跟进支持MCP？如果这些公司也加入支持行列，MCP极有可能成为人工智能行动的通用“语言”，推动人工智能互操作性迈向新的高度，为人工智能领域带来更为广阔的发展前景。

参考资料：https://venturebeat.com/ai/the-open-source-model-context-protocol-was-just-updated-heres-why-its-a-big-deal/