让 AI 搭3D乐高,为什么这么难?VAST 联合浙大等高校开源LegoACE

AIGC动态12小时前发布 ai-front
92 0 0
让 AI 搭3D乐高,为什么这么难?VAST 联合浙大等高校开源LegoACE

 

文章摘要


【关 键 词】 结构生成乐高生成隐式学习自回归生成模型

生成式人工智能在文本和图像等领域已取得显著进展,但在物理世界的结构化生成中仍面临复杂约束的挑战。以乐高搭建为例,模型不仅需要视觉合理,还必须满足砖块间的几何匹配与物理连接规则。传统的乐高生成方法通常依赖人工显式定义连接规则,导致系统扩展性差且难以处理种类繁多的不规则零件。针对这一瓶颈,研究团队提出了LegoACE模型,探索让机器自主学习物理世界的组合规律。

LegoACE摒弃了人工标注连接点的传统思路,将乐高搭建转化为一个序列预测问题。通过将每块砖的空间和类型信息编码为位置、旋转和类型令牌,模型能够像处理自然语言一样处理三维离散结构。为支撑这种数据驱动的学习方式,研究构建了包含数万个模型和数千种砖块的大规模数据集LegoVerse。该模型在无需显式输入连接规则的前提下,成功从海量真实样本中隐式学习到了复杂的砖块组合与搭建规律。

在应用层面,LegoACE支持文本描述和多视角法线图两种条件生成方式,并结合数据增强与直接偏好优化技术,提升了生成结构与目标的契合度。结果表明,该方法在效率上优于传统体素扩散方法,且能灵活运用各类专用零件,生成表现力更强的乐高模型。

这项研究的核心价值在于推动了生成式人工智能从单纯的内容生成向受约束的结构生成迈进。其提出的隐式学习范式不仅适用于乐高,还为分子设计、电路布局及机器人结构等复杂系统提供了新思路。尽管隐式学习在罕见组合下仍可能面临物理拼接挑战,但将数据驱动的学习能力与显式几何验证相结合,将是未来人工智能构建真实物理世界的重要方向。

原文和模型


【原文链接】 阅读原文 [ 4917字 | 20分钟 ]
【原文作者】 AI前线
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★

© 版权声明
xunfeiagent

相关文章

trae

暂无评论

暂无评论...