阶跃星辰开源GUI智能体,本地部署的GELab-Zero-4B,精通Android应用

AI-Agent2小时前发布 AIGCOPEN
44 0 0
阶跃星辰开源GUI智能体,本地部署的GELab-Zero-4B,精通Android应用

 

文章摘要


【关 键 词】 AI智能体移动应用本地化推理隐私保护工程基建

阶跃星辰开源了首个完整的GUI智能体解决方案GELab-Zero,该方案包含4B参数量的轻量化模型和即插即用的工程套件,能够在消费级硬件上实现完全本地化的Android应用自动化操作。基于GUI的解决方案被公认为当前阶段的最佳路径,它通过视觉识别和触控操作与应用程序交互,具备对所有应用程序的通用兼容性,且无需应用开发商进行额外接口适配。然而,移动应用生态系统的碎片化特征构成了巨大工程壁垒,包括不同品牌设备、屏幕分辨率、系统版本和应用版本的差异。

GELab-Zero的核心价值在于提供了一套完整的推理工程基础设施,支持一键启动,自动处理环境依赖和设备管理,将推理链路从云端拉回本地。该方案能够自动识别连接设备,适配不同分辨率和系统环境,并支持多设备任务分发,显著提升兼容性测试和任务执行效率。此外,GELab-Zero详细记录交互轨迹,便于后续分析和优化。它支持多种智能体工作模式,包括ReAct模式、多智能体模式和定时任务模式,满足不同场景需求。相关研究论文已被机器学习顶级会议NeurIPS 2025接收,验证了其技术架构的先进性和严谨性。

GELab-Zero的4B GUI Agent模型专为Android环境优化,能够在消费级硬件上流畅运行,无需昂贵服务器支持。本地化部署不仅降低了成本,还从根本上杜绝了隐私泄露风险,所有数据处理均在本地完成。这种设计在处理个人生活服务类任务时具有显著优势,兼顾低延迟与隐私保护

GELab-Zero在复杂任务中表现出色,包括跨应用交互、长流程逻辑判断和多约束条件下的决策。例如,在科幻电影推荐、旅游目的地推荐、企业福利平台操作和地铁线路查询等任务中,模型展现了强大的自然语言理解和视觉识别能力。多商品购物任务尤其体现了模型的高精度决策能力,需要精准识别商品名称、规格和口味等细节。

阶跃星辰提出了AndroidDaily基准测试,聚焦现代生活的六大核心维度——食、行、购、住、讯、娱,更准确地评估GUI智能体的实用价值。测试包含静态测试和端到端测试两种模式,覆盖3146个动作和235个任务。在静态基准测试中,GELab-Zero-4B-preview的准确率达到0.734,远超通用大模型。端到端测试中,它在GUI理解、定位和交互等多个维度表现优异,特别是在AndroidWorld测试中达到75.86%的成功率。

GELab-Zero通过开源方式大幅降低移动端智能体开发门槛,将工程基建能力赋予每位开发者,同时通过本地化模型解决隐私和成本问题。这一方案为移动端智能体的规模化落地提供了切实可行的路径,有望推动AI技术向消费级终端设备的进一步渗透。

原文和模型


【原文链接】 阅读原文 [ 3493字 | 14分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...