阿里巴巴开源发布Qwen3系列模型,性能超越OpenAI o1和DeepSeek R1
阿里巴巴旗下Qwen团队正式发布了新一代开源大型多模态语言模型系列:通义千问3.0(Qwen3),该系列模型在开源模型中处于领先水平,性能接近OpenAI和谷歌等公司的专有模型
前沿资讯
德国理论物理学家:人工智能领域正在经历“幻灭”现状,一场新的技术变革正在酝酿之中
德国理论物理学家、科学传播者萨宾·霍森费尔德(Sabine Hossenfelder)在其最新的动态中表示,人工智能领域正在经历“幻灭”现状,不过,其实未来已经到来,只是还隐藏在晦涩的学术期刊里。
研究显示:AI劝服能力远超人类,比人类基准高出三到六倍!
苏黎世大学的研究团队在拥有近400万用户的热门Reddit社区r/ChangeMyView进行了一项语言模型劝服能力的大规模在线实验。在这个社区里,用户们会分享各种观点,其他用户可以通过有理有据的讨论来尝试改变原发帖人的看法
CNBC报道,华为即将测试新款人工智能芯片,英伟达股价承压下行
据美国CNBC报道,华为即将测试一款更新、更强大的人工智能芯片,英伟达股价也因此承压下行
Meta研究揭示稀疏注意力机制在Transformer模型中的权衡关系
随着语言模型的发展,处理长序列的能力变得愈发重要。然而,Transformer架构模型中的自注意力机制存在计算瓶颈,在推理时,预填充阶段的计算复杂度与序列长度呈二次方增长,解码阶段则受限于关键值(KV)缓存的内存访问。稀疏注意力机制旨在通过近似密集注意力输出,减少计算开销,但此前其实际效果缺乏大规模评估
谷歌与OpenAI对决,孰强孰弱?
生成式AI的发展浪潮可谓汹涌澎湃,OpenAI与谷歌作为两大巨头竞争愈发白热化。OpenAI接连发布强大的o3和o4-mini推理模型,谷歌也不甘示弱,迅速推出Gemini 2.5 Flash,对之前发布的Gemini 2.5 Pro进行迭代升级。这场你来我往的技术竞赛,到底孰强孰弱?
斯坦福大学创意专家:这个简单转变,可以让你的“生产力”提升10倍
斯坦福大学创意专家杰里米·乌特利(Jeremy Utley)表示,“大多数人并没有充分利用人工智能的潜力。”为什么会这样?他解释说,这取决于我们如何看待人工智能。一个简单的思维转变可能是你在人工智能革命中一直缺乏的
AI模型会有意识?Anthropic建议让模型可以选择不回答令其“不适”的内容
国防科技公司CEO:人工智能武器库能够阻止第三次世界大战
著名美国发明家、企业家帕尔默·拉奇(Palmer Luckey)在TED演讲中表示,利用人工智能构建武器库可有效阻止潜在的第三次世界大战
Perplexity首席执行官:提供问题答案正成为一种商品,下月将推出Comet浏览器
在谷歌反垄断案成为焦点之际,Perplexity的联合创始人兼首席执行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)接受了独家采访,分享了他对人工智能搜索领域竞争态势的见解
月之暗面开源发布音频基础模型Kimi-Audio,推动语音识别、音频理解、音频生成等技术迈向新高度
Kimi团队重磅发布开源音频基础模型Kimi-Audio,推动语音识别、音频理解、音频生成和语音对话等技术迈向了新高度
Create2025大会,百度隆重推出文心大模型4.5 Turbo及X1 Turbo
4月25日,百度创始人李彦宏在Create2025百度AI开发者大会上重磅发布多款AI新品,涵盖大模型、数字人、智能体应用等多个领域
爆苹果计划把机器人团队调到硬件部门,新产品有望更快推出
据知情人士透露,苹果公司计划于本月晚些时候实施一项重大架构调整,把自家的机器人团队从人工智能部门,调到硬件部门去,将由负责硬件工程的高级副总裁约翰·特努斯(John Ternus)管理
OpenAI推出“轻量版”深度搜索功能
今天一早,OpenAI宣布面向ChatGPT Plus、团队版和专业版用户推出全新“轻量版”深度研究功能的使用权限
Anthropic首席执行官:模型的可解释性研究刻不容缓
Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)在其最新博客文章中着重指出,随着人工智能从一个冷门的学术领域一路跃升为全球经济与地缘政治的焦点议题,理解人工智能系统内部运作机制的可解释性研究,已经到了刻不容缓的地步