从“甜蜜”到“互撕”?微软自研“MAI”模型剑指OpenAI,BST技术能否颠覆AI格局?

前沿资讯 2月前更新

0

微软与OpenAI曾是紧密的合作伙伴,在OpenAI的发展历程中扮演了重要角色。微软先后向OpenAI投资约130-140亿美元,为其提供了关键的资金支持。微软凭Azure云服务还为OpenAI提供了强大的云计算基础设施,助力OpenAI在早期快速发展。随后,微软成为OpenAI的独家云服务提供商,使得OpenAI能够专注于人工智能技术的研发,而微软也借助OpenAI的技术,在自身的一些产品和服务中融入前沿的AI能力,实现了互利共赢。

然而,如今情况已发生明显变化。微软正在积极研发自己的先进人工智能模型,据报道,其内部开发了一个称为“MAI”的大语言模型。微软为此组建了专业的研发团队,投入大量的人力、物力和时间进行研究与开发,MAI系列模型旨在与OpenAI的GPT系列以及其他领先模型竞争。

微软还对MAI模型进行了全面且深入的测试,尝试将其应用于旗下热门AI助手Copilot系统。Copilot目前在很大程度上依赖OpenAI的模型,在实际应用中,Copilot可以为用户提供撰写文档、管理电子表格、辅助编码等功能。但随着业务的发展和对成本、技术自主性的考量,微软希望通过引入MAI模型,减少对外部合作伙伴的依赖,降低成本并获取更多灵活性。有消息称,MAI模型在主要基准测试中的表现与OpenAI等领先模型相当,例如在语言理解、生成准确性以及上下文关联等关键指标的测试中,MAI模型展现出了强大的实力,在某些特定场景下甚至超越了部分竞争对手的模型。

除了自研模型,微软还在测试来自Meta、xAI、Deepseek、Anthropic等第三方的模型。微软的研究人员对这些不同来源的模型进行了多轮对比测试,从模型的性能、适应性、资源消耗等多个维度进行评估。通过这些细致的测试,微软希望找到最适合自身业务需求的模型,或者从不同模型中汲取优势,进一步优化自己的AI技术。

在人工智能领域,高昂的成本是促使微软做出这些改变的重要因素之一。维护大语言模型需要巨额开支,AI芯片单价在1万至3万美元不等,整组服务器机架成本超50万美元。OpenAI据传将推出每月收费高达2万美元的AI代理,这一高价让不少企业望而却步。以Softbank为例,其今年已向OpenAI投入30亿美元用于购买AI代理,虽然Softbank认为这些代理若能完成金融和研究领域顶尖专家的工作,这笔投资是值得的,但并非所有企业都有如此雄厚的资金实力。相比之下,一些小型初创公司提供的编码代理每月仅需约500美元,虽然在功能和性能上可能不及OpenAI的高端代理,但价格上的巨大差异,使得更多中小企业倾向于选择价格亲民的产品。

在合作关系方面,微软今年调整了与OpenAI的协议,不再担任其独家云服务提供商,仅保留优先拒绝权,意味着OpenAI可自由选择其他云服务提供商,如甲骨文。双方在战略规划和业务发展上的差异逐渐显现,与此同时,各方在人工智能基础设施上的投入不断加大,微软计划在2025财年投资约800亿美元建设AI数据中心,部分资金将投向印度。微软在印度的投资,希望利用当地丰富的技术人才资源和相对较低的运营成本,建立高效的AI研发和数据处理中心,加速其在人工智能领域的布局。

在技术研究层面,微软研究院取得了重要进展,提出了“信仰状态变换器(Belief State Transformer,BST)”这一创新概念。传统的大语言模型多为从左到右的单向模型,只能获取过去的信息,在处理一些需要规划和全局理解的任务时存在局限性。而BST则采用前向编码器和后向编码器,能同时吸收前文和后文的信息,不仅可以预测下一个标记,还能预测序列中的前一个标记。

以“星图导航问题”为例,传统单向模型在面对多分支路径,需要从起始节点找到目标节点的任务时,常因忽略目标节点而随意猜测下一个有效节点,导致效果不佳。这是因为单向模型在训练过程中,一旦形成了这种简单的“捷径”策略,就很难通过基于梯度的训练方法进行纠正,就如同解决复杂的奇偶函数问题一样困难。而BST通过要求AI预测后缀之前的内容,使其在训练过程中难以走捷径,从而有效解决了这一问题。

在生成连贯故事的任务中,基于BST的模型在语法、流畅性、连贯性和创造性方面表现出色,生成的故事过渡自然、逻辑合理。微软的研究团队使用GPT4对生成的故事进行评估,从语法准确性、情节流畅度、上下文连贯性以及创意新颖性等多个维度进行打分。结果显示,BST生成的故事在各项指标上都有显著优势,相比之下,传统单向模型生成的故事常出现突然中断或逻辑混乱的情况。虽然目前BST模型在参数规模上(约8000万参数)与GPT4(数千亿参数)仍有差距,但该技术原理具有可扩展性。研究人员通过一系列实验验证了BST在不同规模数据和任务下的有效性,并且初步探索了如何进一步扩大其规模,以提升性能。

微软在人工智能领域正多管齐下,通过自研MAI模型、测试外部模型以及推进BST等基础研究,力求在竞争中占据优势。如今,微软已将OpenAI视为搜索、广告等领域的竞争对手,昔日的合作伙伴关系逐渐演变为既竞争又合作的“亦敌亦友”关系。在搜索领域,微软希望通过自身AI技术的提升,为用户提供更精准、个性化的搜索结果,与OpenAI在搜索引擎市场展开竞争;在广告领域,微软借助AI技术优化广告投放策略,提高广告效果和投放效率,与OpenAI以及其他竞争对手争夺市场份额。

对于广大用户和行业而言,这场巨头间的竞争有望带来更多创新成果。我们将会看到更多元化的AI服务,这些服务将在更多领域得到应用,同时,我们也可以期待随着竞争加剧,高昂的AI服务费用能够有所下降。但也不排除领先的AI服务提供商继续聚焦高端企业客户,维持高价策略。无论如何,人工智能领域的这场激烈竞争,必将推动行业加速发展,为我们的日常生活和工作带来更多变革。

参考资料:https://www.youtube.com/watch?v=FKZktotIeRA