
前沿资讯
1755159541更新
1
昆仑万维今日宣布,天工超级智能体核心引擎——Skywork Deep Research Agent完成v2版本重磅升级,并同步推出业界首个“多模态深度调研智能体”与“多模态深度浏览器智能体”。新版本在信息检索、跨模态理解、长周期任务执行等维度全面刷新行业最佳水平,为AI Office场景带来更高质量、更高效率、更具视觉表现力的智能办公体验。
多模态深度调研智能体:
传统Deep Research Agent受限于纯文本检索,常遗漏财报曲线、论文配图、社媒对比图等关键信息。Skywork Deep Research Agent v2首次将多模态爬取(MM-Crawler)、长距离多模态信息收集、异步并行Multi-Agent理解及跨模态结果呈现等四大自研技术整合进深度研究工作流,实现“读文字+看图片”一体化。
经实测,Agent可自动识别、理解并嵌入高质量配图,或对图片信息进行再加工生成全新图表,显著降低读者理解成本,报告完成度与专业度大幅提升。该功能已在skywork.ai全量上线,全球用户可即时体验。
多模态深度浏览器智能体:
针对传统浏览器脚本兼容性差、延迟高、任务完成度低等痛点,昆仑万维推出Skywork Browser Agent。该智能体基于升级后的DOM+视觉推理方案、并行搜索、多动作规划与智能筛等自研技术,可模拟人类浏览行为,对小红书、Twitter、Instagram等平台图文、视频及评论情绪进行深度分析,并一键生成可视化网页报告。
目前,该功能已进入邀测阶段,预计近期向全部用户开放。用户只需一句指令,即可获得如「香港旅游攻略」「周杰伦应援信息站」等即用型网页,实现社媒线索梳理到成果展示的无缝闭环。
在权威BrowseComp搜索评测中,Skywork Deep Research Agent v2常规模式正确率已达27.8%,开启自研“并行思考”模式后,成绩可跃升至38.7%,刷新了行业SOTA纪录,并随推理时间延长持续攀升。同时,在GAIA等综合评测中,Agent均以显著优势领先现有模型,验证其在复杂推理与长周期任务中的综合实力。团队已同步开放API预览,开发者可通过GitHub官方仓库提交申请。
昆仑万维首度披露v2版本四大技术支柱:
● 高质量数据合成:三阶段端到端流程,确保问题多样性、正确性与挑战性;
● 端到端强化学习:基于非对称验证原则与GRPO算法,配合动态课程与生成式密集奖励,显著减少奖励hacking;
● 高效并行推理:自研异步并行框架,引入“并行思考+锦标赛排序+熵自适应剪枝”组合拳,兼顾性能与成本;
● 多智能体演进:MCP Manager Agent实现MCP工具“生成—验证—持久化—复用”闭环,支持在线动态扩展与协同办公。
即日起,全球用户可登录skywork.ai(国际站)或tiangong.cn(中国站)免费体验Skywork Deep Research Agent v2全功能,企业及开发者亦可申请API接入,共建下一代AI Office生态。
参考资料:Day4/5:Skywork Deep Research Agent重磅升级!带来更多模态、更高质量和更高效的体验