登顶全球权威榜单!浙大创业团队百卡打造开源实时世界模型,视频秒变可交互4D世界

登顶全球权威榜单!浙大创业团队百卡打造开源实时世界模型,视频秒变可交互4D世界

 

文章摘要


【关 键 词】 世界模型3D架构实时仿真国产突破范式革新

在2024年全球科技界对“世界模型”的激烈角逐中,中国初创企业影溯(InSpatio)发布开源模型InSpatio-World,并在权威榜单WorldScore-Dynamic中力压主流AI巨头,实现从“像素生成”到“物理仿真”的关键跨越。

该模型以轻量化、高效率与强实时性为突破口,在训练成本、推理速度及模型参数规模上均展现出显著优势:仅用数百万元训练周期,即在专业级显卡上实现24FPS推理;百卡算力可完成快速训练,单张RTX 4090显卡即可稳定运行10FPS——大幅降低部署门槛。

其核心技术路径在于摒弃传统2D视频驱动的“视觉统计”路线,转向基于三维空间的“状态锚定建模”,实现观测视角与物理实体的本质解耦;依托显式状态建模、时空自回归框架与联合分布蒸馏等机制,将海量视频中的视觉信息高效凝练为具物理一致性的4D动态世界表示。

这一范式使得世界不再是静态画面序列,而是具备响应性、可回溯、可交互的“数字存在”。

在自动驾驶领域,它推动系统构建可控虚拟世界以闭环优化策略;在VR/AR中,它加速内容自动生成缓解供给瓶颈;在具身智能方向,则赋予机器人在行动前进行多路径模拟与决策推演的能力。

团队由鲍虎军教授领衔学术研究、章国锋教授主导成果转化、刘浩敏博士带领工程落地,形成“从0到1再从1到N”的产学研深度融合闭环。

当前已有数十家机器人、自动驾驶及内容产业巨头展开深度合作意向,显示出该模型已进入产业化加速阶段。

业界普遍认为,这标志着世界模型正从“生成内容”走向“构建世界”,而影溯的突破,正在成为全球AI竞争格局中最具潜力的中国变量。

InSpatio-World通过状态锚定建模实现了从“像素模拟”到“物理仿真”的本质跃迁其极低算力需求使4D世界建模真正迈向普适化应用技术路线的成功印证了“架构胜过规模”的关键判断模型支持自由暂停、精准回溯和即时介入,让动态世界的交互性成为现实这一范式的演进,标志着AI能力正从‘理解图像’进阶至‘理解因果’与‘规划行动’


原文和模型


【原文链接】 阅读原文 [ 3112字 | 13分钟 ]
【原文作者】 机器之心
【摘要模型】 qwen3-vl-flash-2026-01-22
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...