首个为手机而生的通用Agent？！苹果做不到的事，“野路子”智谱抢先实现了

1,567 0 0

文章摘要

【关键词】 Siri升级、AutoGLM、AI Agent、手机AI、隐私安全

苹果预计在2026年对Siri进行重大升级，使其具备自主行动能力，在WWDC 2024主题演讲中展示了让Siri跨应用执行任务的设想，但完整落地的执行型Agent尚未推出。有传言称，真正的iPhone AI代理还需几年时间，因其对技术、安全性和生态要求极高。

8月20日，国产大模型厂商智谱发布了AutoGLM 2.0，宣称这是全球首个可在手机上使用的Agent，开创了“Agent + 云手机 / 云电脑”新技术范式，突破硬件限制，能在任何设备和场景运行，帮助用户代理操作。用户只需一句话，AutoGLM 2.0就能操作多个高频应用完成任务，让AI成为全能代理人。

AutoGLM项目于2023年底立项，历经多个版本迭代，最终采用“云端手机 + 云端电脑”形式。目前AutoGLM 2.0已在国内免费开放。相比传统Chatbot，Agent任务复杂度和消耗量更高，但AutoGLM基于国产模型，成本降低一个数量级。在Device Use基准测试中，AutoGLM表现优于部分竞品，处于主流Agent的SOTA水平。

在技术层面，AutoGLM 2.0由智谱语言模型GLM – 4.5和视觉推理模型GLM – 4.5V支持，结合“端到端异步强化学习”新方法，可灵活调用MobileRL、ComputerRL和AgentRL执行任务。其中，MobileRL提升视觉语言智能体推理与训练效率，结合其训练出的AUTOGLM – Mobile – 9B在不同测试环境有不同成功率；ComputerRL提升智能体在桌面端操作与决策效率，结合其训练出的AUTOGLM – OS – 9B在OSWorld基准测试有一定准确率。

随着AI Agent战争爆发，智能手机行业格局将变。手机OEM厂商可能是国内大模型厂商重要切入点，未来手机上可能多Agent共存。大型科技公司准备利用人工智能代理强化生态系统，若OEM未能占据主动，可能沦为硬件组装商，需构建开放AI生态系统。但目前手机AI Agent存在任务成功率低和隐私安全问题，苹果与华盛顿大学研究强调AI要理解操作后果，确保行为可控和隐私安全是手机Agent进入C端的基础。