SubQ新架构将1200万token上下文成本打到原来的零头/ GPT-5.5成为ChatGPT默认模型 / Grok 4.3在工具调用领域抢到头牌-AI前沿快讯-AI工具导航

提交工具关于我们

SubQ新架构将1200万token上下文成本打到原来的零头/ GPT-5.5成为ChatGPT默认模型 / Grok 4.3在工具调用领域抢到头牌

前沿资讯 1778047483更新

今天刷到了一些资讯消息，整理出来给大家看看。

不废话，直接上内容。

SubQ——长上下文的新思路

目前，LLM在处理长上下文方面有个根本问题：Transformer架构里，每个token都要跟所有token比一遍，计算量是二次方增长的。上下文越长，成本涨得越猛。

SubQ换了个思路。它不是二次方，而是次二次方——什么意思呢？

它的注意力机制通过内容依赖选择，将注意力路由到真正重要的位置，其他一律跳过。

结果呢？

1200万token的上下文窗口，基于SSA架构，在100万token时比FlashAttention快52倍，成本不到Claude Opus的5%。

RULER基准测试里得分95%，跟Opus 4.6的94.8%基本持平。在更难的MRCR测试（需要在超长上下文里找出多个分散的相关信息并整合）里，得分65.9%，GPT-5.5是74%。

差距是有的，但考虑到价格和速度，这个表现相当能打。

还有一个骚操作——它的编程工具SubQ Code支持直接加载整个代码库，让AI一次性能规划、执行、审查。不需要多Agent系统那种协调开销。

说实话，这种从架构层面重新设计的东西，比在现有框架上打补丁有意思多了。

SubQ怎么用？官方给了两种方式。

API方式 ——面向开发者和企业团队。调用接口就能把整个代码仓库、管道状态一次性处理，按线性成本收费。1200万token上下文窗口，支持流式输出和工具调用，兼容OpenAI的接口协议。

Code方式 ——面向编程Agent。可以直接插到Claude Code、Codex、Cursor里用，让AI更快地探索代码库、收集上下文、回答消耗大量token的问题。官方说实际用下来，账单能省25%左右，速度能快10倍。安装也简单，一行命令搞定。

两种方式现在都在内测，需要去官网申请。

GPT-5.5 Instant——默认模型升级了

OpenAI上线了GPT-5.5 Instant，现在已经是ChatGPT的默认模型。

主要升级了几个点：

幻觉问题大幅减少。官方说比GPT-5.3减少了52.5%的幻觉问题，特别是在医学、法律、金融这些高风险领域提升最明显。

数学和代码能力也强了一截。OpenAI自己秀了个例子：同一道代数题，GPT-5.3算错了直接说"无解"，GPT-5.5算错了会回头检查、找出错误步骤、用二次公式重新解出来。

这种"错了但不认错，然后突然醒悟"的能力，确实有点像人类了。

还有一个我比较关注的是记忆和个性化。ChatGPT现在可以调用你之前的聊天记录、保存的记忆、甚至连接的Gmail账号里的内容，来给出更贴合你的回答。

而且它会显示——它用了哪段记忆、哪个聊天，你可以删掉或者改。这个透明化的设计挺好的。

Realtime TTS-2——语音模型的新高度

Inworld AI发了一个实时语音模型，叫Realtime TTS-2。

几个亮点：

能理解对话的完整音频上下文，不只是你说的内容，还包括你的情绪、语气、节奏。它能判断"怎么说的"和"说什么"一样重要。

支持自然语言指挥声音风格。你不用调参数，直接说"能不能更活泼一点"，它就懂了。

能在100多种语言之间即时切换，同时保持说话人的声音特征不变。比如你用英文说话，让它转说法语，声音还是你的。

最离谱的是可以用文字描述生成声音。你写一段描述，比如"温柔但带点沙哑的女声"，它就能生成一个可复用的声音。

这个应用场景太多了。每个需要角色扮演的场景都能用。

Grok 4.3——xAI又追了一步

xAI发布Grok 4.3，在Artificial Analysis的agentic工具调用和指令遵循分类里直接冲上了第一。

啥第一？Agentic工具调用和指令遵循。在ValsAI排行榜的法律和金融企业级场景里也是第一。

支持100万token上下文，价格百万输入、2.50/百万输出。比Claude和GPT都便宜。

xAI这家公司确实能追，现在Grok 4.3已经在工具调用这个维度抢到了头牌。

MATLAB Agentic Toolkit——AI直接操作MATLAB

MathWorks发了一个工具包，让AI Agent能直接与MATLAB交互。

包含两部分：

第一，MATLAB MCP Core Server。这是让AI能直接调用MATLAB执行代码的接口。之前也有，但安装配置麻烦，这个工具包一键搞定。

第二，一套Agent Skills。简单说就是Markdown文件，教AI怎么用MATLAB特有的方式写代码、调试、写单元测试、构建App、优化性能。

之前AI写MATLAB代码像在黑暗中摸索，现在有了使用手册。

作者Mike Croucher举了个例子：让Claude Code更新一个旧MATLAB脚本。加Skills之前，Claude会写代码、试运行、报错、再改。加了之后，Claude会自动先跑代码分析器检查问题，遵循MATLAB最佳实践，考虑代码标准。

参考资料：

https://subq.ai/introducing-subq

https://openai.com/index/gpt-5-5-instant/

https://x.com/xai/status/2051703217697010103

https://x.com/inworld_ai/status/2051699438201282992

https://x.com/MATLAB/status/2051612619086135802