Cosine AI 推出的 Genie,被誉为全球最强的 AI 程序员

工具推荐 1723687977更新

1

      在AI编程助手领域,由Cosine AI推出的Genie,被誉为全球最强的AI程序员。在SWE-Bench测试平台上,Genie以30.08%的评分遥遥领先,不仅击败了Devin的13.8%,也超越了Swe-agent+GPT-4的12.47%。

      Genie的核心优势在于其能够模拟人类工程师的认知过程。Genie的训练采用了数十亿token数据,这些数据不仅包含了多种编程语言,如Java、JS、C、C++、C#、Rust和Python等,还包括了人类程序员在实际开发中的活动和推理过程。

      Genie的训练方法同样具有创新性。它采用了自我改进机制,通过使用初代版本的Genie生成包含错误的合成数据,然后用这些数据训练下一版模型。这一过程不断重复,使得Genie在解决错误和应对复杂情况时变得更加准确和高效。

      此外,Genie的训练重点放在了数据的质量上。Cosine团队花了近一年的时间整理数据集,包括来自真实工程师的大量软件开发活动,确保了Genie的训练数据集具有高度的实用性和真实性。Genie的开发得到了OpenAI的支持,并使用了最新的GPT-4o模型。

      Genie作为一款AI编程助手,其在编程领域的应用场景相当广泛,能够显著提升软件开发的效率和质量。以下是Genie的具体应用场景:

      自动化代码生成:Genie可以根据需求自动编写代码,减少开发者的重复工作,让开发更为迅速高效。

      问题解析与迭代思考:Genie能够理解并解析问题,例如GitHub Issue,自动确定所需解决的软件问题,并进行迭代思考以找到最佳解决方案。

     深入分析与优化:Genie会对问题进行深入分析,不断迭代优化解决方案,提高代码的质量和性能。

      自动运行与调试:编写完成后,Genie能够自动运行代码,并在遇到错误时进行调试和修正,实现高度自动化的测试流程。

     自我学习和改进:Genie使用旧版本生成的错误代码作为训练数据,通过自我改进机制进行学习和优化,使得解决方案更加精准。

     多方式触发工作:Genie可以通过提示词、GitHub Issue、Linear Ticket或API等多种方式启动工作流程,提供灵活的交互方式。

      软件开发全周期支持:Genie的应用不仅限于编写代码,还能覆盖软件开发的各个阶段,包括需求分析、设计、编码、测试和维护。

      缺陷修复与代码审查:Genie支持分析现有代码,识别并修复潜在的错误和缺陷,同时提供代码审查功能,确保代码质量。

      系统重构建议:在系统架构或代码库需要改进时,Genie可以提供重构建议和实施策略,帮助改进现有系统。

      目前,Genie还处于内测阶段,已经开放了申请试用的通道。Genie背后的Cosine团队虽然仅有5人,但他们成功完成了250万美元的种子轮融资。由Uphonest和SOMA Capital领投,Lakestar和Focal等公司跟投,这也表明了市场对该技术潜力和应用前景的信心。