开源项目OpenSquilla（皮皮虾）：给AI装上"智能路由器"：简单任务不再调最贵的模型，成本直降九成-AI工具推荐-AI工具导航

提交工具关于我们

开源项目OpenSquilla（皮皮虾）：给AI装上"智能路由器"：简单任务不再调最贵的模型，成本直降九成

工具推荐 1781491957更新

前两天，有个朋友跟我吐槽，说他用 AI Agent 帮自己处理日常工作，一个月下来 API 费用都快赶上他半个月工资了。

我问他怎么用的，他说就是让 AI 帮他写写邮件、查查资料、偶尔跑跑脚本。每次任务感觉也没多复杂，但月底一对账，发现光 Token 消耗就离谱得很。

我就问他，你有没有想过，其实不是 AI 贵，而是你可能一直在用"高射炮打蚊子"？

他一脸懵，说啥意思？

我跟他说，现在很多 AI Agent 其实有一个很普遍的问题，就是不管你问的是什么，它都把任务交给你指定的模型来处理，而这个模型还可能是个高价的。

你问它"今天天气怎么样"，它调 Opus。你让它帮你写一封简单的请假邮件，它还是调 Opus。你让它帮你算一道 1+1 等于几，它思考了三十秒，调用了一整套推理链，然后告诉你等于 2。

就是夸张到这种程度。

效率？不存在的。省钱？做梦。

朋友说，那有没有什么办法能让 AI 变得更"聪明"一点，就是知道什么时候该用什么级别的模型？

这就是我今天想聊的东西了。

最近我在试用一个开源项目，叫 OpenSquilla（皮皮虾），来取代之前的 Openclaw 和 Hermes。

OpenSquilla 是一个本地运行的 AI Agent 框架，就跟 Openclaw 和 Hermes 一样，能帮你完成各种任务，运行的一切都在本地。

那这个跟省钱的有什么关系呢？

关系大了。

OpenSquilla 里面有一个叫 SquillaRouter 的东西，这是它的核心功能之一。

用官方的话说，这是一个本地的、轻量级的模型路由器。它会在每次你跟 AI 对话的时候，先分析一下你这个任务到底有多复杂，然后决定把它交给哪个层级的模型。

我举个例子。

比如你问它"帮我把这段话翻译成英文"，这是一个相对简单的任务，路由就会把它分配到一个比较便宜的模型，比如 T0 或者 T1 级别的。

但如果你让它"帮我分析一下这家公司的财务状况，写一份完整的投资报告"，这个任务复杂多了，路由就会把它分配到更强的模型。

整个过程都在你的本地电脑上完成，不需要把数据发送到第三方服务器去做分类判断。

朋友问，那它是怎么判断任务复杂度的？

这就涉及到技术层面了。SquillaRouter 会根据多个维度来评分，包括任务的长度、语言、是否包含代码、关键词特征，还有语义embedding。简单理解就是，它会"读"一下你输入的内容，然后给出一个综合评分，决定这个任务应该交给哪个层级的模型处理。

这个分层的概念也很有意思。OpenSquilla 把模型分成了四个层级，从 T0 到 T3。T0 是最基础最便宜的，T3 是最强大的。日常简单的对话、翻译、格式化这类任务，通常 T0 或 T1 就够了。只有真正复杂的推理、分析、创意写作这类任务，才需要上升到 T2 或 T3。

根据他们自己跑出来的 benchmark 测试，用了这个路由机制之后，同样一批任务跑下来，成本降到了原来的九分之一左右，但得分几乎一模一样。

这个数据我觉得还是挺有说服力的。

不只是省钱这一个卖点。

当然，如果你觉得省钱不是你的首要考量，那 OpenSquilla 还有其他一些值得关注的点。

首先它的记忆功能。

OpenSquilla 有一个持久化的本地记忆系统，你可以往里面存东西，比如你的个人偏好、工作习惯、项目背景。然后下次再跟它对话的时候，它就能"记住"这些信息，而不需要你每次都重新交代。

这个功能对于需要一个长期助手的场景来说，还是挺实用的。

第二个是它的技能系统。

OpenSquilla 里面内置了 15 个常用的技能，比如写代码、GitHub 操作、定时任务、生成 PPT/PDF/Excel 文档这些。这些技能你可以理解为是给 AI 装备了一个工具箱，但它不是把所有工具都背在身上，而是需要哪个才拿哪个。

第三个是内置的 Web 搜索功能。

它自带了搜索能力，帮你查资料的时候不用再切出去开浏览器。而且这个搜索还有 SSRF 保护，简单说就是防止你在让它访问某个网址的时候被偷偷带去别的危险地方。

第四个是安全性。

OpenSquilla 有一个分层的沙箱机制，它把工具调用分成了不同的权限等级。比如 Standard、Strict、Locked 三档，不同等级能调用的东西不一样。这对于防止 AI 误操作或者执行一些危险命令来说，还是挺有必要的。

不过需要注意的是，Windows 的沙箱功能目前还没有完整实现，macOS 的沙箱则只能渲染策略文件，还不能真正执行隔离。如果你对安全性要求特别高，这块可能还需要观望一下。

安装和使用。

说了这么多，你可能会问，这东西到底好不好上手？

我自己的体验是，官方做了几个不同难度的安装方式，选择挺多的。

Windows 用户如果不想装 Python 环境，可以直接下载 portable 版本，就是那种绿色版，解压就能跑。Mac 和 Linux 用户也可以用类似的思路，通过 uv 这个工具来安装。

具体来说，就是一行命令的事：

uv tool install --python 3.12 "opensquilla[recommended] @ `https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl` "

装完之后，运行 opensquilla onboard 做初始化配置，然后 opensquilla gateway run 就能启动了。

启动之后会开一个本地的 Web 控制台，在浏览器里访问 127.0.0.1:18791/control/ 就能看到。

整体来说，对于有基本命令行经验的人来说，上手难度不算高。

我怎么看。

说实话，这类本地运行的 AI Agent 框架，这两年我也陆陆续续试过不少。

有些做得确实不错，但要么价格不便宜，要么配置太复杂，要么就是功能太单一，用起来总觉得差点意思。

OpenSquilla 让我觉得有意思的地方在于，它把几个关键的东西整合在了一起：省钱的多模型路由、多入口的使用方式、持久化的本地记忆和技能系统，还有相对完善的安全机制。

不是那种"一个功能做到极致"的思路，而是"几个核心功能都做到可用"的思路。

对于想要一个相对完整的本地 AI 助手解决方案的人来说，它是一个值得考虑的选择。

最后，回到开头那个朋友的问题。

我跟他说，如果你在用 AI 的时候发现每个月的账单越来越离谱，可以想想是不是模型选型的问题。一个好的路由机制，能在保证效果的前提下，让你的成本降下来很多。

当然，这只是我的个人看法，不构成任何建议。

有兴趣的朋友，可以去他们的 GitHub 仓库看看，文档写得挺详细的，自己判断适不适合。

项目地址：

https://github.com/opensquilla/opensquilla/