首个为手机而生的通用Agent?!苹果做不到的事,“野路子”智谱抢先实现了

AI-Agent20小时前发布 ai-front
79 0 0
首个为手机而生的通用Agent?!苹果做不到的事,“野路子”智谱抢先实现了

 

文章摘要


【关 键 词】 Siri升级AutoGLMAI Agent手机AI隐私安全

苹果预计在2026年对Siri进行重大升级,使其具备自主行动能力,在WWDC 2024主题演讲中展示了让Siri跨应用执行任务的设想,但完整落地的执行型Agent尚未推出。有传言称,真正的iPhone AI代理还需几年时间,因其对技术、安全性和生态要求极高。

8月20日,国产大模型厂商智谱发布了AutoGLM 2.0,宣称这是全球首个可在手机上使用的Agent,开创了“Agent + 云手机 / 云电脑”新技术范式,突破硬件限制,能在任何设备和场景运行,帮助用户代理操作。用户只需一句话,AutoGLM 2.0就能操作多个高频应用完成任务,让AI成为全能代理人。

AutoGLM项目于2023年底立项,历经多个版本迭代,最终采用“云端手机 + 云端电脑”形式。目前AutoGLM 2.0已在国内免费开放。相比传统Chatbot,Agent任务复杂度和消耗量更高,但AutoGLM基于国产模型,成本降低一个数量级。在Device Use基准测试中,AutoGLM表现优于部分竞品,处于主流Agent的SOTA水平。

在技术层面,AutoGLM 2.0由智谱语言模型GLM – 4.5和视觉推理模型GLM – 4.5V支持,结合“端到端异步强化学习”新方法,可灵活调用MobileRL、ComputerRL和AgentRL执行任务。其中,MobileRL提升视觉语言智能体推理与训练效率,结合其训练出的AUTOGLM – Mobile – 9B在不同测试环境有不同成功率;ComputerRL提升智能体在桌面端操作与决策效率,结合其训练出的AUTOGLM – OS – 9B在OSWorld基准测试有一定准确率。

随着AI Agent战争爆发,智能手机行业格局将变。手机OEM厂商可能是国内大模型厂商重要切入点,未来手机上可能多Agent共存。大型科技公司准备利用人工智能代理强化生态系统,若OEM未能占据主动,可能沦为硬件组装商,需构建开放AI生态系统。但目前手机AI Agent存在任务成功率低和隐私安全问题,苹果与华盛顿大学研究强调AI要理解操作后果,确保行为可控和隐私安全是手机Agent进入C端的基础。

原文和模型


【原文链接】 阅读原文 [ 2253字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...