别只盯着李飞飞!AI的「3D数据底座」已被这家中国公司悄悄建好

AIGC动态20小时前发布 AIera
81 0 0
别只盯着李飞飞!AI的「3D数据底座」已被这家中国公司悄悄建好

 

文章摘要


【关 键 词】 具身智能3D数据集空间智能仿真数据机器人训练

群核科技正在构建具身智能时代的「3D版ImageNet」,其推出的SpatialVerse平台通过提供高质量三维数据与仿真环境,试图解决Sim2Real(仿真到现实)的难题。该平台结合3D高斯溅射技术与空间大模型,发布了全球首个大规模3D语义数据集InteriorGS,为AI理解和适应物理世界奠定了基础。这一举措被视为可能像ImageNet推动深度学习一样,加速具身智能的发展。

具身智能的崛起离不开对3D世界的深刻理解和丰富交互,而当前面临的最大挑战是数据困境。与2D图像数据不同,3D数据的获取成本和难度呈指数级上升。群核科技早在2018年推出的InteriorNet数据集曾引起学术界关注,但AI进入物理世界仍需更多高质量3D数据。目前行业主要通过三种途径获取训练数据:真实数据、互联网数据和仿真合成数据,但每种方式都存在明显局限性。

真实数据虽然完全符合物理规律,但存在成本高昂、采集效率低和复现性差等问题。互联网数据则缺乏交互性和物理信息,从人类视频中学习得来的策略不一定适用于机器人。仿真合成数据是目前的主流方式,但传统仿真环境存在「Reality Gap」问题,模拟的物理真实性受限,且对仿真平台依赖大。早期模拟器中的场景往往真实感不足,导致智能体学到的技能难以直接迁移到现实。

群核科技的优势在于十多年产业场景中沉淀的大量室内空间3D数据。其核心产品酷家乐已广泛应用于家居、建筑、商超等多个领域,为空间大模型SpatialLM的训练提供了独特的数据基础。2024年推出的SpatialVerse平台不仅能模拟物体的物理属性,还能生成具有多样性的新场景,帮助智能体更好地适应真实世界。这一平台已获得学术界和产业界的广泛认可,包括谷歌、斯坦福大学以及多家具身智能企业的合作。

在2025年WAIC大会上,群核科技提出了结合3D高斯溅射、空间大模型和物理仿真的全新数据生成范式。3D高斯技术能够高效复刻物理世界,空间大模型则赋予场景语义理解能力。基于这一范式,群核发布了InteriorGS数据集,包含1000个精细的3D高斯语义场景,覆盖80多种室内环境。这是全球首个适用于智能体自由运动的大规模3D数据集,已在多个平台开源供开发者使用。

高质量3D数据将成为智能体理解物理世界的基础。通过虚拟场景训练,机器人可以在各种环境中练习技能,这些体验将转化为真实世界中的高效执行。不仅机器人,AIGC和XR等新兴智能体也需要此类数据进行模型训练。当智能体能够真正理解空间并适配物理规则时,人机协同的边界将被彻底改写,机器人有望成为养老保姆,XR将深度融入人类生活和工作。在具身智能全面到来之前,行业正致力于搭建连接数字与物理世界的桥梁。

原文和模型


【原文链接】 阅读原文 [ 3838字 | 16分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...