零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人

AIGC动态2天前发布 AIera
104 0 0
零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人

 

文章摘要


【关 键 词】 机器人开源泛化预训练数据集

智源研究院在2025机器人学习大会上开源了通用「小脑基座」RoboBrain-X0,旨在解决机器人行业「一机一调」的开发困境。该模型通过预训练即可实现零样本跨本体泛化,无需微调就能驱动多种不同构造的真实机器人,显著提升了机器人智能的规模化部署潜力。这一突破性技术通过统一建模视觉、语言与动作,实现了从感知到执行的一体化能力,为机器人行业带来了全新的发展机遇。

RoboBrain-X0的核心创新在于其学习「做什么」而非「怎么动」的设计理念。传统机器人模型通常死记硬背特定机器人的控制信号,导致跨本体迁移能力极差。相比之下,RoboBrain-X0通过「本体映射机制」将任务分解为与机器人身体无关的通用语义动作序列,再实时翻译成具体机器人的可执行指令。这种抽象化的动作表达方式,使得不同机器人能够「听懂」同样的指令,大幅提升了模型的泛化能力和计算效率。

技术架构上,RoboBrain-X0采用了分层推理框架,将控制流分解为任务意图解析、标准化动作序列生成和可执行指令翻译三个层次。这种任务、动作、控制逐层解耦的设计,不仅保障了模型的跨本体迁移性和可解释性,也为稳定执行复杂任务提供了技术基础。模型通过引入统一动作表征体系,将各种机器人的复杂动作拆解成标准的「动作词汇表」,并用类似自然语言处理的tokenizer机制进行编码,实现了动作表达的高度抽象和高效推理。

跨本体真机数据集的开源是RoboBrain-X0成功的关键支撑。该数据集包含了视觉与语义理解数据、开源动作数据、厂商合作数据以及自采高质量轨迹,覆盖了多样化的场景和任务类型。这些数据不仅强化了模型的跨本体可迁移性,也为后续研究提供了可比较、可复现的基础。在权威评测中,RoboBrain-X0的综合成功率高达96.3%,远超基线模型π0。在真实机器人测试中,其总体成功率达到了48.9%,是π0的近2.5倍,基础抓放任务更是实现了100%的成功率。

智源此次开源行动是其整体战略的重要一环。继此前开源具身大脑RoboBrain 2.0和跨本体协同框架RoboOS 2.0后,此次开源预训练基座和数据集,标志着智源正在构建一个完整的具身智能开源生态。虽然通用具身智能仍面临鲁棒性、长时程任务规划等挑战,但通过开放核心技术,智源为全球开发者社区注入了强大动能,有望加速推动机器人技术的创新发展。

原文和模型


【原文链接】 阅读原文 [ 2567字 | 11分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...