世界模型的新用途：不做选手，去当裁判

46 0 0

文章摘要

地瓜机器人发布世界模型Uranus，其定位并非具身智能的大脑，而是作为机器人开发的基础设施，旨在解决行业内在评测基准公信力不足以及仿真到真实场景存在差距两大痛点。开发团队认为，机器人想要变得更聪明，首先需要建立一个能够支持反复试错、稳定考试并复盘成绩的平台。

在评测基准方面，Uranus开创了全新的第三条路径。传统真机评测效率低且难以复现，常规仿真评测则存在明显的现实鸿沟。该模型能够根据输出动作逐步生成环境反馈并计算指标。这种方式不仅大幅提升了迭代效率，还能有效控制变量并稳定复现，确保评测分数与真实场景中的实际能力高度正相关，从而提供极具公信力的评测服务。

在仿真训练方面，Uranus直接通过数据学习生成场景，显著缩小了仿真与现实的差距。其核心技术在于实现了帧级闭环，能够像实时交互一样逐步生成视频并接收动作反馈，突破了长序列误差累积瓶颈。此外，模型具备跨具身零样本泛化能力，但暂不支持运动控制训练。构建此类基础设施面临像素级生成、跨视角一致性及帧级闭环等极高技术壁垒。做机器人基础设施的底层技术难度，实际上远高于开发具身大脑。

在研发过程中，团队将大部分精力投入到了基础设施搭建与数据处理的繁杂工作中。通过优化分层存储与算力协调方案，并对开源数据进行深度清洗，模型性能获得显著提升。比起单纯追求庞大数据规模，数据的质量和多样性对模型训练更为关键。当前的具身行业核心仍在于数据工程，模型决定了发展下限，而高质量数据决定了能力的上限。