阶跃星辰开源GUI智能体，本地部署的GELab-Zero-4B，精通Android应用

1,068 0 0

文章摘要

阶跃星辰开源了首个完整的GUI智能体解决方案GELab-Zero，该方案包含4B参数量的轻量化模型和即插即用的工程套件，能够在消费级硬件上实现完全本地化的Android应用自动化操作。基于GUI的解决方案被公认为当前阶段的最佳路径，它通过视觉识别和触控操作与应用程序交互，具备对所有应用程序的通用兼容性，且无需应用开发商进行额外接口适配。然而，移动应用生态系统的碎片化特征构成了巨大工程壁垒，包括不同品牌设备、屏幕分辨率、系统版本和应用版本的差异。

GELab-Zero的核心价值在于提供了一套完整的推理工程基础设施，支持一键启动，自动处理环境依赖和设备管理，将推理链路从云端拉回本地。该方案能够自动识别连接设备，适配不同分辨率和系统环境，并支持多设备任务分发，显著提升兼容性测试和任务执行效率。此外，GELab-Zero详细记录交互轨迹，便于后续分析和优化。它支持多种智能体工作模式，包括ReAct模式、多智能体模式和定时任务模式，满足不同场景需求。相关研究论文已被机器学习顶级会议NeurIPS 2025接收，验证了其技术架构的先进性和严谨性。

GELab-Zero的4B GUI Agent模型专为Android环境优化，能够在消费级硬件上流畅运行，无需昂贵服务器支持。本地化部署不仅降低了成本，还从根本上杜绝了隐私泄露风险，所有数据处理均在本地完成。这种设计在处理个人生活服务类任务时具有显著优势，兼顾低延迟与隐私保护。

GELab-Zero在复杂任务中表现出色，包括跨应用交互、长流程逻辑判断和多约束条件下的决策。例如，在科幻电影推荐、旅游目的地推荐、企业福利平台操作和地铁线路查询等任务中，模型展现了强大的自然语言理解和视觉识别能力。多商品购物任务尤其体现了模型的高精度决策能力，需要精准识别商品名称、规格和口味等细节。

阶跃星辰提出了AndroidDaily基准测试，聚焦现代生活的六大核心维度——食、行、购、住、讯、娱，更准确地评估GUI智能体的实用价值。测试包含静态测试和端到端测试两种模式，覆盖3146个动作和235个任务。在静态基准测试中，GELab-Zero-4B-preview的准确率达到0.734，远超通用大模型。端到端测试中，它在GUI理解、定位和交互等多个维度表现优异，特别是在AndroidWorld测试中达到75.86%的成功率。

GELab-Zero通过开源方式大幅降低移动端智能体开发门槛，将工程基建能力赋予每位开发者，同时通过本地化模型解决隐私和成本问题。这一方案为移动端智能体的规模化落地提供了切实可行的路径，有望推动AI技术向消费级终端设备的进一步渗透。