文章摘要
蚂蚁集团旗下灵波科技宣布全面开源具身大模型LingBot-VLA,这是该公司首款开源的具身智能基座模型,具备跨本体和跨任务泛化能力,同时显著降低了后训练成本。灵波科技作为蚂蚁集团在具身智能领域的重要布局,此前已推出单场景服务机器人Robbyant-R1和高精度空间感知模型LingBot-Depth。此次开源不仅包含模型权重,还提供了全套代码库,涵盖数据处理、高效微调及自动化评估等功能。
LingBot-VLA基于20000+小时的大规模真机数据进行预训练,覆盖了9种主流双臂机器人构型,有效解决了因本体差异、任务差异和环境差异导致的泛化性挑战。通过与LingBot-Depth模型的配合,该模型能够获得更高质量的深度信息表征,从而提升空间感知能力。在上海交通大学开源的GM-100评测基准中,LingBot-VLA的跨本体泛化平均成功率从Pi0.5的13.0%提升至15.7%,而在引入深度信息后,成功率进一步增至17.3%。在RoboTwin2.0仿真基准测试中,面对高强度环境干扰,其操作成功率比Pi0.5提升了9.92%。
灵波科技在数据采集和预训练阶段得到了多家硬件平台和创新中心的支持,包括星海图、松灵、乐聚等。目前,LingBot-VLA已与多家厂商完成适配,验证了其在不同构型机器人上的跨本体迁移能力。蚂蚁灵波科技CEO朱兴表示,高效的具身基座模型是具身智能实现规模化应用的关键,直接决定了技术的可用性和经济性。通过开源LingBot-VLA,灵波科技旨在推动具身智能研发进入可复用、可验证和可规模化落地的新阶段,构建完整的技术体系与开源生态,加速AI在物理世界的普及。
原文和模型
【原文链接】 阅读原文 [ 1030字 | 5分钟 ]
【原文作者】 机器人前瞻
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆



