BFM-Zero,让人形机器人不再依赖高质量动捕数据

AIGC动态2小时前发布 aitechtalk
53 0 0
BFM-Zero,让人形机器人不再依赖高质量动捕数据

 

文章摘要


【关 键 词】 机器人仿真训练潜在空间零样本稳定性

CMU与Meta研究团队合作,清华姚班李忆唐作为第一作者提出的最新论文成果,为解决人形机器人从仿真环境到现实世界的跨域能力提供了创新方案。该研究通过无监督预训练构建统一潜在空间,使机器人能够在不依赖精细规则或昂贵数据的情况下,实现真实场景中的稳定、自然和可靠表现。核心方法是将奖励、姿态、动作序列等任务提示压缩到同一潜在空间中,机器人仅需生成合适的潜在向量即可零样本执行动作,并在面对扰动时快速恢复稳定。

实验分为仿真环境测试、真实机器人部署及快速适应三部分。在仿真阶段,模型在Isaac和Mujoco两种物理特性差异较大的环境中表现出色,动作跟踪误差控制在可接受范围,目标姿态到达任务尤为稳健,即使面对训练数据外的动作库(如AMASS)也能成功执行。真实环境测试中,Unitree G1人形机器人展示了零样本能力,包括复杂动作跟踪、自然摔倒恢复及噪声输入下的稳定表现。其动作连贯性源于潜在空间的结构化设计,无需专门训练恢复技能。

快速适应能力是另一关键突破。通过优化潜在向量而非调整网络权重,机器人能在负载增加或摩擦变化等新条件下快速恢复性能。例如,四公斤负载下仅需20次迭代即可实现稳定单腿站立,摩擦变化导致的跳跃轨迹误差降低近30%。这种轻量级适应方式显著提升了现实部署的可行性。

研究框架分为无监督预训练、零样本推理和少量样本适应三个阶段。预训练阶段通过1024个并行仿真环境积累五百万条交互样本,结合物理随机化和风格约束,形成通用行为经验库。零样本阶段通过潜在向量直接解释任务需求,支持动作生成、目标到达和奖励驱动行为。适应阶段则利用交叉熵优化或双重退火策略,在潜在空间中快速搜索新条件的最优解。

该研究的核心价值在于为通用行为模型奠定基础。其潜在空间设计使机器人动作兼具自然性与鲁棒性,外力干扰下能像人类一样柔顺调整。同时,方法降低了对高质量动作捕捉数据的依赖,通过无标注序列即可学习人体风格。未来可通过语言解析奖励组合,进一步实现高层任务意图的理解与执行。

论文成果标志着人形机器人向通用智能迈出关键一步。其统一潜在空间架构不仅解决了仿真到现实的鸿沟,还为行为级基础模型提供了可扩展框架,对具身智能的自主决策与适应性发展具有深远意义。相关技术将在2025年GAIR大会的世界模型分论坛中深入探讨,推动学术成果向产业应用转化。

原文和模型


【原文链接】 阅读原文 [ 5087字 | 21分钟 ]
【原文作者】 AI科技评论
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...