文章摘要
【关 键 词】 世界模型、物理一致、国产算力、隐式三维、生成世界
由腾讯和米哈游前员工组成的Mogo团队推出了Magpie 1.0,这是全球首个具备高动态物理交互能力的世界模型。该模型的核心突破在于实现了长达10分钟的绝对物理一致性实时输出,确保了车辆翻滚、角色跑酷等动态交互完全符合真实物理直觉。团队在研发中做出了明确的取舍,将有限的算力优先投入到物理仿真和空间思考中,而非单纯追求高精度的画面渲染。
在研发过程中,团队遭遇了严重的算力短缺危机。面对云厂商算力续订困难和成本飙升的现状,Mogo团队另辟蹊径,在缺乏适配方案的情况下,成功在国产芯片上完成了世界模型的关键训练。随后,团队又将模型迁移回英伟达芯片进行后续训练与推理适配,最终摸索出一条结合国产与进口算力的创新工程路径,有效缓解了算力瓶颈。
在技术架构方面,Mogo并未遵循现有的JEPA、3D高斯泼溅或纯视觉生成等主流路线。团队开创了基于隐式三维特征的全新路径,将三维空间约束和物理规律隐式地植入模型数据与训练过程中。这种设计使模型能够在内部理解物体间的物理关系,从而在无需显式构建三维模型的情况下,大幅提升了长时间生成的一致性和物理准确性。
Magpie 1.0的底层技术积累源于团队此前在三维人体动作生成、单图三维建模及空间感知等领域的深厚学术研究。Mogo的长远愿景是推动生成式人工智能从单纯的生成内容跨越到真正的生成世界,致力于让模型不仅能呈现世界的外观,更能理解和模拟世界的运行规律。这一从拟象走向仿真的尝试,被视为通往通用人工智能的重要基石,并有望在未来重塑规模庞大的游戏产业。
原文和模型
【原文链接】 阅读原文 [ 3420字 | 14分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★



