前沿资讯
1778047483更新
0
今天刷到了一些资讯消息,整理出来给大家看看。
不废话,直接上内容。

SubQ——长上下文的新思路
目前,LLM在处理长上下文方面有个根本问题:Transformer架构里,每个token都要跟所有token比一遍,计算量是二次方增长的。上下文越长,成本涨得越猛。
SubQ换了个思路。它不是二次方,而是次二次方——什么意思呢?
它的注意力机制通过内容依赖选择,将注意力路由到真正重要的位置,其他一律跳过。
结果呢?
1200万token的上下文窗口,基于SSA架构,在100万token时比FlashAttention快52倍,成本不到Claude Opus的5%。

RULER基准测试里得分95%,跟Opus 4.6的94.8%基本持平。在更难的MRCR测试(需要在超长上下文里找出多个分散的相关信息并整合)里,得分65.9%,GPT-5.5是74%。
差距是有的,但考虑到价格和速度,这个表现相当能打。
还有一个骚操作——它的编程工具SubQ Code支持直接加载整个代码库,让AI一次性能规划、执行、审查。不需要多Agent系统那种协调开销。
说实话,这种从架构层面重新设计的东西,比在现有框架上打补丁有意思多了。
SubQ怎么用?官方给了两种方式。
API方式 ——面向开发者和企业团队。调用接口就能把整个代码仓库、管道状态一次性处理,按线性成本收费。1200万token上下文窗口,支持流式输出和工具调用,兼容OpenAI的接口协议。
Code方式 ——面向编程Agent。可以直接插到Claude Code、Codex、Cursor里用,让AI更快地探索代码库、收集上下文、回答消耗大量token的问题。官方说实际用下来,账单能省25%左右,速度能快10倍。安装也简单,一行命令搞定。
两种方式现在都在内测,需要去官网申请。

GPT-5.5 Instant——默认模型升级了
OpenAI上线了GPT-5.5 Instant,现在已经是ChatGPT的默认模型。
主要升级了几个点:
幻觉问题大幅减少。官方说比GPT-5.3减少了52.5%的幻觉问题,特别是在医学、法律、金融这些高风险领域提升最明显。

数学和代码能力也强了一截。OpenAI自己秀了个例子:同一道代数题,GPT-5.3算错了直接说"无解",GPT-5.5算错了会回头检查、找出错误步骤、用二次公式重新解出来。
这种"错了但不认错,然后突然醒悟"的能力,确实有点像人类了。
还有一个我比较关注的是记忆和个性化。ChatGPT现在可以调用你之前的聊天记录、保存的记忆、甚至连接的Gmail账号里的内容,来给出更贴合你的回答。
而且它会显示——它用了哪段记忆、哪个聊天,你可以删掉或者改。这个透明化的设计挺好的。

Realtime TTS-2——语音模型的新高度
Inworld AI发了一个实时语音模型,叫Realtime TTS-2。
几个亮点:
能理解对话的完整音频上下文,不只是你说的内容,还包括你的情绪、语气、节奏。它能判断"怎么说的"和"说什么"一样重要。
支持自然语言指挥声音风格。你不用调参数,直接说"能不能更活泼一点",它就懂了。
能在100多种语言之间即时切换,同时保持说话人的声音特征不变。比如你用英文说话,让它转说法语,声音还是你的。
最离谱的是可以用文字描述生成声音。你写一段描述,比如"温柔但带点沙哑的女声",它就能生成一个可复用的声音。
这个应用场景太多了。每个需要角色扮演的场景都能用。

Grok 4.3——xAI又追了一步
xAI发布Grok 4.3,在Artificial Analysis的agentic工具调用和指令遵循分类里直接冲上了第一。
啥第一?Agentic工具调用和指令遵循。在ValsAI排行榜的法律和金融企业级场景里也是第一。
支持100万token上下文,价格百万输入、2.50/百万输出。比Claude和GPT都便宜。
xAI这家公司确实能追,现在Grok 4.3已经在工具调用这个维度抢到了头牌。

MATLAB Agentic Toolkit——AI直接操作MATLAB
MathWorks发了一个工具包,让AI Agent能直接与MATLAB交互。
包含两部分:
第一,MATLAB MCP Core Server。这是让AI能直接调用MATLAB执行代码的接口。之前也有,但安装配置麻烦,这个工具包一键搞定。
第二,一套Agent Skills。简单说就是Markdown文件,教AI怎么用MATLAB特有的方式写代码、调试、写单元测试、构建App、优化性能。
之前AI写MATLAB代码像在黑暗中摸索,现在有了使用手册。
作者Mike Croucher举了个例子:让Claude Code更新一个旧MATLAB脚本。加Skills之前,Claude会写代码、试运行、报错、再改。加了之后,Claude会自动先跑代码分析器检查问题,遵循MATLAB最佳实践,考虑代码标准。
参考资料:
https://subq.ai/introducing-subq
https://openai.com/index/gpt-5-5-instant/
https://x.com/xai/status/2051703217697010103
https://x.com/inworld_ai/status/2051699438201282992
https://x.com/MATLAB/status/2051612619086135802
豫公网安备41010702003375号