Cosine AI 推出的 Genie，被誉为全球最强的 AI 程序员-AI工具推荐-AI工具导航

Cosine AI 推出的 Genie，被誉为全球最强的 AI 程序员

在AI编程助手领域，由Cosine AI推出的Genie，被誉为全球最强的AI程序员。在SWE-Bench测试平台上，Genie以30.08%的评分遥遥领先，不仅击败了Devin的13.8%，也超越了Swe-agent+GPT-4的12.47%。

Genie的核心优势在于其能够模拟人类工程师的认知过程。Genie的训练采用了数十亿token数据，这些数据不仅包含了多种编程语言，如Java、JS、C、C++、C#、Rust和Python等，还包括了人类程序员在实际开发中的活动和推理过程。

Genie的训练方法同样具有创新性。它采用了自我改进机制，通过使用初代版本的Genie生成包含错误的合成数据，然后用这些数据训练下一版模型。这一过程不断重复，使得Genie在解决错误和应对复杂情况时变得更加准确和高效。

此外，Genie的训练重点放在了数据的质量上。Cosine团队花了近一年的时间整理数据集，包括来自真实工程师的大量软件开发活动，确保了Genie的训练数据集具有高度的实用性和真实性。Genie的开发得到了OpenAI的支持，并使用了最新的GPT-4o模型。

Genie作为一款AI编程助手，其在编程领域的应用场景相当广泛，能够显著提升软件开发的效率和质量。以下是Genie的具体应用场景：

自动化代码生成：Genie可以根据需求自动编写代码，减少开发者的重复工作，让开发更为迅速高效。

问题解析与迭代思考：Genie能够理解并解析问题，例如GitHub Issue，自动确定所需解决的软件问题，并进行迭代思考以找到最佳解决方案。

深入分析与优化：Genie会对问题进行深入分析，不断迭代优化解决方案，提高代码的质量和性能。

自动运行与调试：编写完成后，Genie能够自动运行代码，并在遇到错误时进行调试和修正，实现高度自动化的测试流程。

自我学习和改进：Genie使用旧版本生成的错误代码作为训练数据，通过自我改进机制进行学习和优化，使得解决方案更加精准。

多方式触发工作：Genie可以通过提示词、GitHub Issue、Linear Ticket或API等多种方式启动工作流程，提供灵活的交互方式。

软件开发全周期支持：Genie的应用不仅限于编写代码，还能覆盖软件开发的各个阶段，包括需求分析、设计、编码、测试和维护。

缺陷修复与代码审查：Genie支持分析现有代码，识别并修复潜在的错误和缺陷，同时提供代码审查功能，确保代码质量。

系统重构建议：在系统架构或代码库需要改进时，Genie可以提供重构建议和实施策略，帮助改进现有系统。

目前，Genie还处于内测阶段，已经开放了申请试用的通道。Genie背后的Cosine团队虽然仅有5人，但他们成功完成了250万美元的种子轮融资。由Uphonest和SOMA Capital领投，Lakestar和Focal等公司跟投，这也表明了市场对该技术潜力和应用前景的信心。