搅局者来了！智谱重磅开源AutoGLM，让“豆包手机”人人可造！官方：AI手机不该掌握在少数厂商手中

771 0 0

文章摘要

智谱团队于2023年4月启动了一项突破性研究，目标是让AI具备真实操作智能手机的能力。经过32个月的开发，其核心成果AutoGLM模型以完整开源形式发布，支持MIT和Apache-2.0双许可证。该模型具备Phone-Use能力框架，能稳定执行外卖点单、机票预订等数十步复杂操作，目前已适配上百款主流APP，并在云端虚拟手机环境中通过强化学习持续优化性能。

开源决策背后体现三重考量：首先，智谱认为AI手机生态建设需行业协同，而非少数厂商垄断。他们将AutoGLM定位为公共技术底座，支持开发者自由改造集成。其次，通过开源实现隐私数据本地化处理，确保敏感信息不离开用户设备。第三，团队希望共享技术积累，包括创新的双层Agent架构（Planner-Grounder设计）、自进化Curriculum RL训练框架，以及大规模云手机集群训练环境，这些技术使模型操作成功率提升至传统方法的2倍。

技术层面，AutoGLM的突破体现在三个方面：行为分层机制解决了”看得懂但点不准”的行业难题；错误恢复能力支持长流程任务执行；虚拟训练环境覆盖WebArena、AndroidLab等多样化场景。2024年11月，该模型成功完成全球首个AI自主发送手机红包的演示，验证了其GUI操作稳定性。

行业数据显示AI手机市场正加速扩张，IDC预测2026年中国市场渗透率将达53%。但当前产品普遍面临“宣传大于实际”的困境，21财经测评显示多数设备在跨App操作时存在卡顿。技术路线分化为依赖App授权的意图框架和基于视觉识别的GUI Agent两派，字节跳动开发的豆包手机即后者代表，其限量测试机在二手市场溢价显著。

第三方AI落地面临权限、数据、配合度三重壁垒，促使手机厂商更倾向与可控性强的大模型供应商合作。智谱采取开放策略，为行业提供模块化技术组件，其角色正从竞争者转变为生态赋能者。随着端侧AI技术成熟，下一代智能终端的入口之争将取决于谁能实现稳定、普适、隐私安全的智能体部署，而开源模式可能成为加速这一进程的关键催化剂。