一手实测 | 智谱AutoGLM重磅开源: AI手机的「安卓时刻」正式到来
文章摘要
【关 键 词】 罗永浩、锤子科技、AI手机、开源项目、智能体
罗永浩的锤子科技虽已落幕七年,但其TNT(Touch&Talk)构想在大模型时代意外成为现实。这一通过触控和语音操作设备的激进设计,如今被验证为最高效的手机交互方式。近期豆包手机助手的爆火,展示了AI Agent通过自然语言和语音输入完成复杂操作的能力,但也引发了隐私担忧。智谱AI的开源项目AutoGLM提供了另一种选择——一个既能执行任务又能保障隐私的本地化智能体框架。
AutoGLM作为全球首个真正操控手机的Agent,实现了从语言理解到实际操作的跨越。其技术核心在于视觉-语言模型对屏幕内容的解析、ADB对设备的控制以及智能规划对任务的拆解。这款9B参数模型不仅能完成发微信、浏览小红书等常规操作,还能处理软件更新等繁琐任务,甚至在误触后能自主修正错误。更值得注意的是,它能跨应用协同,例如调用Gemini完成搜索报告任务,展现出”超级胶水”般的服务整合能力。
智谱选择全面开源AutoGLM具有深远意义。项目包含核心模型、工具链及50多款中文App的演示,采用宽松的开源协议。这种开放策略不仅解决了隐私问题——所有数据处理都在本地完成,还打破了行业垄断可能。开源使AutoGLM成为AI Agent领域的公共基础设施,类比安卓系统对智能手机生态的影响。其虚拟手机方案将AI操作与真实设备隔离,体现了”先学规则再学本事”的审慎态度。
从技术演进看,AutoGLM代表了AI从聊天到行动的范式转变。它实现的首个AI全自动发红包事件,标志着大模型真正具备了工具使用能力。这种进步既带来便利也伴随风险,因此智谱在2025年推出云端虚拟手机版本,确保安全边界。项目的开源文档和透明代码,让开发者和用户都能验证其隐私保护机制。
AutoGLM的开源可能重塑人机交互格局。不同于封闭生态,它将AI手机的门槛降至最低,使个人DIY成为可能。这不仅呼应了罗永浩当年TNT的愿景,更通过开源社区的力量,为AI Agent的爆发式发展奠定了基础。在各大应用限制第三方助手的背景下,这种去中心化的解决方案或许能打破平台壁垒,让智能助手真正服务于用户而非商业利益。正如项目宣言所示,智谱希望将已探索的技术道路转化为整个行业的起跑线。
原文和模型
【原文链接】 阅读原文 [ 3266字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★




