智谱开源AutoGLM:把手机交给AI操作,50+中文App即刻可用
工具推荐
1765261614更新
3
导读:智谱宣布开源 AutoGLM,让“会自己点手机”的智能助手真正落地。
智谱今天宣布把 AutoGLM 完整开源,这是他们从 2023 年 4 月开始、历时 32 个月做出的“Phone Use”方案。该代理工具可以像人一样看懂屏幕,替用户完成手机里的重复动作。

开源部分包括: 9B 多模态模型、Phone Use 框架、50+ 常用中文 App 示范,以及让新手 10 分钟跑起来的“一键包”。
1. 一键包到底给了什么?
- 训练好的核心模型(AutoGLM-Phone-9B) 基于 GLM-4V 系列,能一次接受 10 张截图,最大 25k 上下文,足够把一整条操作流程看完。
- Phone Use 框架 把“截图→理解→规划→执行”做成标准流水线,内置弹窗、广告、弱网容错,不用再踩“乱点死循环”的坑。
- 50+ 中文 App 示范 外卖、电商、出行、社交、办公全覆盖,官方已跑通美团、淘宝、钉钉、小红书、12306 等,直接抄作业即可。
- 安卓适配层与云手机方案 真机、模拟器、云端虚拟手机都能接;敏感数据本地落盘,微信/支付默认黑名单,公司内网可私有化部署。
- MIT + Apache 双许可证 模型可商用,代码可闭改,二创不用回传,真正的“拿走就是用户的”。
2. 新手 10 分钟速通指南:
① 环境准备
- 电脑装 Python≥3.10 和官方 ADB(解压后把路径写进环境变量)。
- 安卓 7.0 以上手机或模拟器,打开“开发者选项 + USB 调试”,顺手装一个「ADB Keyboard」输入法(框架自动切换,避免键盘遮挡)。
② 拉代码 & 依赖
git clone https://github.com/zai-org/Open-AutoGLMcd Open-AutoGLMpip install -e .③ 启动模型服务(两种方式)
- 懒人版:直接用 vLLM 一行命令起 OpenAI 兼容接口,本地 8000 端口即开即用。
- 资源紧张版:把 AutoGLM-Phone-9B 推到带 GPU 的远程服务器,改 --base-url 即可,Agent 端无需改代码。
④ 跑第一条任务
USB 连上手机,终端输入:
python main.py --base-url http://localhost:8000/v1 "打开美团搜索附近的火锅店"屏幕实时截图,Agent 一边思考一边点,完成后自动回显“任务成功”。Wi-Fi 远程同理,先 adb connect IP:5555 再 --device-id 指定即可。
3. 特点功能:
- 自然语言一句话下单 “帮我在饿了么点一份少辣黄焖鸡,加一瓶可乐”→自动拆成:启动→搜索→选店→选菜→备注→结算,全程无需脚本录制。
- 遇到登录/验证码自动喊停 内置 takeover_callback,碰到图形验证码、支付密码立即暂停并弹提示,人工处理完回车继续,安全不盲操作。
- 云手机隔离,敏感 App 默认黑名单 官方提供 Docker 镜像,内置安卓模拟器;微信、支付宝、相册等默认不可见,公司可把整套环境迁进内网,数据不出境。
- 多设备同控 支持 USB + Wi-Fi 混合接入,批量测试时一条命令指定 --device-id,可同时跑多台手机或模拟器。
- Verbose 模式,调试用眼不用猜 打开 verbose=True,每一步都会打印“当前看到了什么→决定点什么”,排查逻辑一目了然。
4. 常见坑提前提醒:
- 设备列表空白 → 99% 是数据线仅充电,换根能传数据的线;再不行就 adb kill-server 后重连。
- 文本输不进去 → 检查是否启用「ADB Keyboard」并授予默认键盘权限;Agent 会在首次输入前自动切换。
- 截图黑屏 → 银行、支付等安全页面系统禁止截屏,Agent 会识别到并主动请求人工接管,不用担心误点。
- 远程 ADB 老断 → 部分机型重启会关闭 TCP/IP,需要重新插 USB 执行 adb tcpip 5555;建议在路由器给手机固定 IP。
智谱坦言 AutoGLM 远非终点,真实世界仍有海量 App 与交互场景等待填补。开源的目的是把“ Phone Use 能力”做成行业公共底座,让研究者、开发者、企业都能把精力花在“创意”而非“重新造轮子”。
如团队所说:“从今天起,人人都可以拥有自己的手机 Agent。” 接下来谁能第一个做出真正 AI 原生的下一代手机,答案在社区手里。
GitHub项目链接:https://github.com/zai-org/Open-AutoGLM
参考资料:https://mp.weixin.qq.com/s/5p0MSgccjqOduErlaf1V4g
豫公网安备41010702003375号