MiniMax推出VIBE-Bench,用“会操作的智能体”评测AI全栈开发能力
MiniMax发布首个全面编码基准测试VIBE-Bench,不仅涵盖Web开发,还覆盖Android、iOS和后端工作流程。更重要的是,它通过智能体直接操作运行环境,从“能不能跑”“好不好用”“好不好看”三个层面,评估AI从0到1完成应用的真实能力
前沿资讯
Manus推出Design View:从生成到精修,AI设计一步到位
AI 生图已经不新鲜,但真正能“用在设计工作流里”的工具并不多。Manus 最新发布的 Design View,正试图解决这个问题:把生成、修改、迭代全部放进一个连续流程中,让 AI 成为设计师顺手可用的工具。
通义百聆语音交互系统开源:能听会说,还能省下一半算力
通义百聆家族开源全新语音对话系统 Fun-Audio-Chat-8B,不仅支持“语音对语音”的自然交流,还通过全新架构设计,在保证语音质量的同时节省近50%的GPU计算。更重要的是,它已经学会在真实对话中主动感知情绪、给出有分寸的回应
智谱AI加码编程与智能体能力,GLM-4.7正式上线并开源
智谱AI(Zhipu AI)上线并开源 GLM-4.7,核心聚焦:编程、推理与智能体式任务执行。新版本通过 Z.ai 平台和开放 API 向全球开发者提供服务,面向真实工程与企业级应用场景。
Qwen-Image-Layered发布:AI图片编辑可以像PS一样分层改
Qwen-Image-Layered 带来一种全新的 AI 图片编辑思路:不是整体重生成,也不是涂掩码,而是把图片直接“拆成图层”。每一层都能单独改、单独移动、单独删,其他部分完全不受影响。
谷歌开源A2UI:让AI不只会聊天,还能“直接生成界面”
谷歌开源了一个“A2UI”项目,试图解决“AI只能输出文字、却不懂界面”的长期痛点。通过一种安全、可移植的UI描述方式,AI代理可以按对话场景生成真正可用的交互界面,为多代理协作、跨平台应用打开了新可能
Wan2.6-Image上线,聚焦可控性与一致性,推进商用级图像生成
Wan2.6-Image 上线,主要变化集中在“更好用、更稳定、更可控”。它不仅能把文字和图片自然地“讲成一个故事”,还在多图参考、角色一致性和镜头控制上进一步贴近真实商用需求
NotebookLM新增“数据表格”功能:零散资料,一键变成可用表格
做研究、写报告时,最花时间的往往不是查资料,而是整理资料。谷歌 NotebookLM 新上线“数据表格”功能,可以把零散信息直接变成结构化成果
玩转千款游戏,英伟达等联合推出AI游戏大神NitroGen
英伟达联合多所名校推出了AI游戏大神:NitroGen,它靠4万小时游戏视频自学成才,既能搞定3D动作游戏的激战,又能玩转2D平台的精准操作,还能快速适配没玩过的新游戏,给通用AI的发展带来了新可能
中国移动把AI降噪“搬进网络里”:通话清不清晰,不再只看手机好不好
通话清不清晰,不再只看手机好不好。中国移动联合多方推出业界首个网络原生AI话音降噪能力,把降噪能力直接部署到话音网络中,让用户在地铁、机场等嘈杂场景下,也能享受到一致、稳定的清晰通话体验
DeepMind开源史上最大可解释性工具集:Gemma Scope 2发布
Google DeepMind 发布 Gemma Scope 2,一套面向 Gemma 3 全系列的开放可解释性工具。它可以像“显微镜”一样分析系统内部的激活与决策过程,是目前 AI 领域规模最大的可解释性工具
Luma AI推出Ray3 Modify:把“真人表演”真正带进AI视频制作
Luma AI 最新发布了 Ray3 Modify,主打“真人先行、AI跟随”的视频制作方式。
Mistral推出OCR 3:手写、表格、扫描件一次搞定
Mistral AI 正式发布 OCR 3,在官方测试中,整体胜率达到 74%,明显领先上一代和多数同类方案。支持手写内容识别,还能还原表格和文档结构,同时,速度和价格也被压到行业新低
英特尔AI工具意外“泄密”?32GB Arc显卡现身,Big Battlemage或已在路上
在最新的AI Playground中,有用户发现了一款标注为32GB显存的Arc GPU,外界猜测,这很可能就是备受关注的“Big Battlemage”
OpenAI在Codex中引SKILLs标准,AI编程助手开始“学会分工干活”
OpenAI 正式在 Codex 中采用由 Anthropic 推出的 SKILLs 标准,让 Codex 能通过可复用的“技能包”完成更具体、更稳定的任务。AI 编程助手正在从“会回答问题”,走向“按流程把事做完”。