Meta再推WorldGen,简单一句话,竟「盖」出50×50米一座城
文章摘要
【关 键 词】 生成式AI、3D世界构建、可交互场景、Meta技术、虚拟现实
Meta最新发布的WorldGen技术标志着生成式AI在3D内容创作领域的重大突破。该系统仅需文本提示即可生成可导航、可交互的完整3D世界,支持如”卡通风格中世纪村庄”或”火星科幻基地”等多样化主题场景生成。与当前主流技术相比,WorldGen通过融合程序化推理、扩散模型和场景分解技术,实现了50×50米范围内几何结构与视觉风格的高度一致性,彻底解决了传统方法中视角偏移导致的画质衰减问题。
技术架构上,WorldGen采用四阶段工作流程:规划阶段通过程序化blockout生成场景布局和导航网格;重建阶段结合图像到3D的基础模型创建初始场景;分解阶段运用AutoPartGen技术提取可复用部件;精修阶段则通过专业模型优化网格与纹理。这种设计使其生成的场景原生支持物理模拟和碰撞检测,可直接导入Unity、Unreal等游戏引擎,无需额外转换流程。
相比斯坦福团队基于Gaussian Splatting的Marble系统,WorldGen选择网格作为基础输出格式具有显著优势。网格结构不仅保证视觉质量稳定,更实现了功能层面的交互性,使得生成内容可直接用于游戏开发和虚拟仿真。测试显示,该系统能准确维持场景主题一致性,例如火星基地不会出现中世纪建筑,村庄内部家具风格也保持统一。
当前版本仍存在生成延迟和规模限制,但Meta已明确将扩展场景尺寸作为重点优化方向。该技术对创意产业影响深远,传统需要数周完成的3D场景构建,现在可通过文本提示在几分钟内生成原型。技术美术人员的工作重心将从基础建模转向AI输出优化,关卡设计师则能快速验证创意概念。
从行业视角看,WorldGen展现了生成式AI降低3D内容创作门槛的潜力。非专业用户首次获得构建复杂虚拟世界的能力,这与Meta推动元宇宙普及的战略高度契合。随着算力优化和功能迭代,该技术有望在游戏开发、虚拟培训、数字孪生等领域产生规模化应用,重新定义人机协作的内容生产模式。
原文和模型
【原文链接】 阅读原文 [ 1717字 | 7分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆




