谷歌开放世界模型一夜刷屏,AI游戏门槛归零时刻来了?
文章摘要
【关 键 词】 谷歌、世界模型、虚拟世界、AI生成、交互体验
谷歌DeepMind近期开放了世界模型Genie 3的实验性研究原型「Project Genie」,允许用户通过AI技术创建、编辑和探索虚拟世界。这一项目由图像生成模型Nano Banana Pro和语言模型Gemini提供技术支持,标志着交互式虚拟环境构建的重大进展。Genie 3的核心能力在于实时生成动态路径,模拟物理效果和交互,使场景从机器人技术到历史还原成为可能。
Project Genie的三大核心功能包括:世界草绘——用户通过文本或图像输入创建可自定义的虚拟环境,并整合Nano Banana Pro进行精准调整;世界探索——实时生成可导航的动态路径,支持视角切换;世界重混——基于现有内容生成新版本,用户可下载探索过程的视频。这些功能共同实现了从静态生成到动态交互的跨越。
尽管Genie 3展现出突破性潜力,谷歌坦言其仍存在局限性:生成内容可能存在物理规律偏差、角色控制延迟、时长限制为60秒,且部分预告功能尚未实现。早期测试者反馈显示,模型在游戏场景生成和物理模拟方面表现惊艳,但细节逻辑仍需优化。例如,用户成功创建了「法国女子攀越飞行物体世界」的互动场景,但也观察到「头顶鸭子的水獭飞行员」等非拟真现象。
目前,Project Genie已面向美国成年Google AI Ultra用户开放,用户可通过文本提示生成包括「好莱坞漫步」等高度可控的交互体验。该技术被视作游戏开发、动画建模等领域的潜在变革者,其持续迭代或将重新定义虚拟内容的生产方式。随着模型成熟,实时生成与物理模拟的精度提升将成为下一步发展关键。
原文和模型
【原文链接】 阅读原文 [ 1284字 | 6分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★☆☆☆



