
前沿资讯
1745835269更新
0
生成式AI的发展浪潮可谓汹涌澎湃,OpenAI与谷歌作为两大巨头竞争愈发白热化。OpenAI接连发布强大的o3和o4-mini推理模型,谷歌也不甘示弱,迅速推出Gemini 2.5 Flash,对之前发布的Gemini 2.5 Pro进行迭代升级。这场你来我往的技术竞赛,到底孰强孰弱?
计算成本成关键因素。谷歌有个“秘密武器”,就是其投入十年研发的定制张量处理单元(TPU)。TPU用于像Gemini模型的训练与服务之类的核心工作负载,这一举措带来了巨大的成本优势。OpenAI及市场上多数企业只能依赖英伟达,据估计,英伟达毛利率极高,数据中心芯片的毛利率在80%左右,谷歌的成本只有购买高端英伟达GPU成本的20%。在硬件层面,每单位计算成本的效率优势可达4-6倍。在API定价上也可以直观看出,OpenAI的o3在输入和输出令牌方面的价格,分别约为谷歌Gemini 2.5 Pro的8倍和4倍。
在智能体框架构建方面,谷歌大力推动互操作性,构建开放生态系统。在Cloud Next大会上,谷歌推出Agent-to-Agent(A2A)协议,可以让不同平台构建的智能体能够相互通信,同时发布了Agent Development Kit(ADK)和Agentspace中心。反观OpenAI,更专注于打造集成在自身技术栈内的工具使用型智能体。o3模型就是典型代表,它能在单个推理链中进行数百次工具调用,开发者可借助相关API和工具在OpenAI/Azure内构建复杂智能体。
模型能力的较量。虽然OpenAI的o3在部分编码基准测试中表现出色,但Gemini 2.5 Pro在其他测试中也毫不逊色,甚至在Arena排行榜上总体领先。两款模型在核心能力上已大致相当,只有具体应用中存在差异。Gemini 2.5 Pro拥有高达100万令牌的上下文窗口(计划扩展至200万),适合处理大型文档和代码库,o3的上下文窗口只有20万,不过其深度推理和工具辅助能力更为突出。另外,o3推理能力虽强,但幻觉率较高,Gemini 2.5 Pro则以更可靠、可预测的特点受到青睐。
在适配与分发方面,谷歌和OpenAI各有千秋。谷歌凭借谷歌云和Workspace,为现有客户提供深度集成服务,旗下产品能无缝协作,帮助用户实现快速价值转化。OpenAI则借助微软的力量,拥有广泛的市场覆盖和易用性。ChatGPT庞大的用户基础使得其产品广为人知,微软还将OpenAI模型嵌入Microsoft 365 Copilot和Azure服务,方便数亿企业用户在日常工具中使用AI能力。对于已经标准化使用微软产品的用户,采用OpenAI技术能够获得更多便捷。
用户在做出选择时,可以综合计算成本、模型能力等多方面因素,并结合自身实际情况,进行抉择,以获得最适合自己的方案。
参考资料:https://venturebeat.com/ai/the-new-ai-calculus-googles-80-cost-edge-vs-openais-ecosystem/
https://x.com/lmarena_ai/status/1915078057452573142/photo/1