Meta推出新款智能眼镜:带屏幕的Ray-Ban与神经腕带组合亮相
马克·扎克伯格(Mark Zuckerberg)在 Connect 大会上发布新品:Meta 与雷朋(Ray-Ban)合作的“Ray-Ban Display 智能眼镜”和“Meta Neural Band 神经腕带”。重点亮点包括:全彩高清显示屏、EMG 手势控制腕带、支持消息提醒、导航、实时翻译和视频通话。售价 799 美元,9 月 30 日率先在美国开售
前沿资讯
Qwen3-ASR-Toolkit上线:长音频转写不再受“3分钟限制
阿里云开源的Qwen3-ASR-Toolkit工具正式发布。它最大的亮点是突破了音频转写3分钟时长限制,支持长音频、长视频的快速转写
Google推出“Learn Your Way”:AI助力个性化互动教材,学习效果显著提升
传统教材往往千篇一律,难以满足每个学生的个性化需求。Google推出了一个称为“Learn Your Way(我的学习方式)”的工具,尝试用AI技术,让教材变得互动且可个性化
DeepMind报告:到2030年,人工智能会是什么样子?
一份由谷歌DeepMind委托、研究员大卫·欧文(David Owen)撰写的报告预测:如果当前的发展趋势持续到2030年,人工智能相关投资可能达到数千亿美元,算力消耗需要以“吉瓦”为单位来计算
从“读DNA”到“写DNA”,首个AI生成基因组问世
Arc Institute研究团队首次利用AI生成完整功能性基因组,选择了具有历史意义的噬菌体ΦX174作为模板,并通过实验验证其可行性
阿里推出通义DeepResearch:开源智能研究助手,性能逼近国际水准
阿里巴巴正式推出开源研究助手通义深度研究(DeepResearch),在多项复杂推理和信息检索测试中表现接近国际领先水平,并全面超越现有开源与闭源系统
Sam Altman简化ChatGPT个性化设置页面,引发用户热议
萨姆·奥特曼(Sam Altman)宣布,ChatGPT的个性化设置页面更新上线,将性格配置、自定义指令和记忆功能整合到同一界面。新版设计中,有用户拿xAI的Grok做对比,认为OpenAI在用户体验上仍有改进空间。整体来看,此次更新虽让页面更简洁,但实际效果仍待验证。
谷歌Gemini上线“照片转视频”功能:静态图秒变8秒动态短片
谷歌在Gemini应用中推出“照片转视频”功能,用户只需上传一张照片并添加描述,就能生成8秒带声音的动态短片。
Gamma 3.0上线:让演示文稿秒变专业视觉故事
Gamma 3.0正式发布,带来全新视觉叙事体验。它不仅解决了传统演示文稿制作繁琐的问题,还推出了Gamma Agent设计助手和Gamma API自动化工具,让创意流程更高效。新版本还支持智能布局、图表生成和品牌统一管理,为高级用户提供Gamma Ultra功能,实现更强的视觉冲击力。
ChatGPT或开放成人内容:奥特曼称应尊重成年用户的使用自
萨姆·奥特曼(Sam Altman)发表署名文章,介绍了OpenAI在隐私、自由与青少年安全三方面的原则与取舍。保护用户隐私是最重要的底线/尊重成年用户的使用自由/青少年群体安全优先于自由和隐私。
李飞飞的Marble上线:浏览与创建沉浸式3D世界变得更简单
AI“教母”李飞飞的World Labs推出全新平台Marble,用户可通过图片或文字提示生成可自由探索的3D世界。生成的世界更大、更丰富、更一致,为创作者提供更高自由度的创作空间。
微软推出“Copilot音频表达”:让文字开口说
微软推出实验性工具“Copilot音频表达”,支持将文字快速转换为自然语音。用户可选择情感模式、故事模式和脚本模式,调节语气、节奏和声音角色。目前该工具仅支持英语,可通过任一新版浏览器免费使用,生成的音频可直接下载为高质量MP3文件,适合教育、内容创作和个人娱乐场景。
腾讯混元3D 3.0发布:建模精度提升3倍,助力专业级
腾讯发布混元3D 3.0模型,建模精度提升3倍,支持36亿体素超高清建模,在人物建模、复杂几何结构和纹理生成上均有显著优化。新版本集成于混元3D AI创作引擎并对用户免费开放,同时推出混元3D Studio专业工作台内测,支持7大核心3D管线环节。混元3D系列已在全球消费级3D打印和设计领域落地应用,推动3D内容创作向普惠化与专业化发展。
ElevenLabs推出Productions,一键搞定字幕、配音和有声书
ElevenLabs 推出全新 Productions 服务,用户可以直接在平台上订购人工校对的文字稿、字幕、配音和有声书。服务由专业语言学团队操作,成本低、速度快、操作简单,支持个人和企业用户使用。
谷歌发布TimesFM 2.5,“开箱即用”,时间序列预测更准确
谷歌发布了TimesFM 2.5,相比TimesFM 2.0,新版本模型在预测准确度和最大上下文长度上都有显著提升。在 GiFT-Eval 排行榜上,TimesFM 2.5在所有零样本基础模型的准确率指标上均名列第一。