Kimi K2.5发布:首次支持Agent集群,一个人就是一支团队

前沿资讯 1769510957更新

2

导读:Kimi K2.5开源发布。该模型不仅在代码、视觉理解、Agent等维度实现了开源SOTA表现,更首次引入了「Agent集群」能力,单个AI模型可以自主创建多达100个"分身",像一支专业团队一样并行协作,复杂任务的执行效率最高可提升4.5倍。


月之暗面发布并开源Kimi K2.5模型,在Agent、代码、图像、视频及一系列通用智能任务上取得开源State-of-the-Art表现。该模型采用原生多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务。

视觉理解+代码能力:让AI"看懂"世界

Kimi K2.5进一步提升了开源模型的代码水平,尤其在前端开发领域表现突出。模型支持从简单的自然语言对话生成完整的前端界面,并能有效处理交互式布局及滚动触发等动态效果。

通过融合视觉能力,K2.5真正降低了编程的门槛,用户可以直接传一段录屏,Kimi K2.5能自动拆解背后的交互逻辑,并用干净、专业的代码将其从头到尾复现出来。

Agent集群:一个人就是一支团队

Kimi K2.5带来了“Agent集群”的全新探索。 面对复杂任务,K2.5不再是一个包揽一切的"全能专家",而是化身为一支即时组建的"专业团队"。它能根据任务需求,现场调度多达100个分身,并行处理1500个步骤。所有的角色分配与任务拆解,无需预设,全由K2.5现场决策。

举个例子:给Kimi Agent集群投喂40篇关于心理学和AI的论文,Kimi会先通过多次调用工具,按顺序把这40篇论文通读一遍,确保上下文完整保留所有必要信息。紧接着,它衍生出几个子agent,分别负责不同章节撰写。最后,主agent负责把关验收,将所有内容汇总生成一份几十页的专业PDF综述。

在评测中,与单Agent执行相比,Agent集群将达成目标性能所需的最少关键步骤减少了3到4.5倍,通过并行化,实际运行时间最高可缩短4.5倍。

办公场景进化:让Office技能变得"人人精通"

K2.5模型将Kimi Agent能力扩展到日常办公领域,开始掌握Word、Excel、PPT、PDF等常用软件的中高阶技能,助用户直接交付准专业水平的办公文档。

当语言难以准确描述时,用户可拍照、截图或录屏传给Kimi,突破文字表达的限制,真正实现"所见即所得"的智能办公体验。

Kimi Code正式发布:编程助手新选择

月之暗面正式推出编程工具Kimi Code。它不仅能在终端里直接运行,还能无缝集成到VSCode、Cursor、JetBrains和Zed等主流编辑器中。

Kimi Code可充分发挥K2.5的多模态优势,支持直接输入图片和视频进行编程辅助,并能自动发现并将用户现有技能迁移到新的工作流中。

Kimi K2.5提供四种模式:

  • 快速模式:提供最快的响应体验
  • 思考模式:用来解答复杂问题
  • Agent模式:擅长深度研究、PPT、Excel、Word、PDF和网页生成等任务
  • Agent集群模式:适合需要并行处理的复杂任务

企业和开发者可通过Kimi开放平台调用K2.5模型的API,在提供Turbo级别速度的同时大幅降低了API价格。即日起Kimi开放平台开始为期7天的充值赠送活动。



参考资料:https://mp.weixin.qq.com/s/Bhn43P1GnGXsvsh5MnN47Q