文章摘要
【关 键 词】 AI手机、开源模型、智能体、隐私保护、行业趋势
智谱团队于2023年4月启动了一项突破性研究,目标是让AI具备真实操作智能手机的能力。经过32个月的开发,其核心成果AutoGLM模型以完整开源形式发布,支持MIT和Apache-2.0双许可证。该模型具备Phone-Use能力框架,能稳定执行外卖点单、机票预订等数十步复杂操作,目前已适配上百款主流APP,并在云端虚拟手机环境中通过强化学习持续优化性能。
开源决策背后体现三重考量:首先,智谱认为AI手机生态建设需行业协同,而非少数厂商垄断。他们将AutoGLM定位为公共技术底座,支持开发者自由改造集成。其次,通过开源实现隐私数据本地化处理,确保敏感信息不离开用户设备。第三,团队希望共享技术积累,包括创新的双层Agent架构(Planner-Grounder设计)、自进化Curriculum RL训练框架,以及大规模云手机集群训练环境,这些技术使模型操作成功率提升至传统方法的2倍。
技术层面,AutoGLM的突破体现在三个方面:行为分层机制解决了”看得懂但点不准”的行业难题;错误恢复能力支持长流程任务执行;虚拟训练环境覆盖WebArena、AndroidLab等多样化场景。2024年11月,该模型成功完成全球首个AI自主发送手机红包的演示,验证了其GUI操作稳定性。
行业数据显示AI手机市场正加速扩张,IDC预测2026年中国市场渗透率将达53%。但当前产品普遍面临“宣传大于实际”的困境,21财经测评显示多数设备在跨App操作时存在卡顿。技术路线分化为依赖App授权的意图框架和基于视觉识别的GUI Agent两派,字节跳动开发的豆包手机即后者代表,其限量测试机在二手市场溢价显著。
第三方AI落地面临权限、数据、配合度三重壁垒,促使手机厂商更倾向与可控性强的大模型供应商合作。智谱采取开放策略,为行业提供模块化技术组件,其角色正从竞争者转变为生态赋能者。随着端侧AI技术成熟,下一代智能终端的入口之争将取决于谁能实现稳定、普适、隐私安全的智能体部署,而开源模式可能成为加速这一进程的关键催化剂。
原文和模型
【原文链接】 阅读原文 [ 3055字 | 13分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★




