谷歌开放世界模型一夜刷屏，AI游戏门槛归零时刻来了？

AIGC动态2个月前发布 almosthuman2014

306 0 0

文章摘要

谷歌DeepMind近期开放了世界模型Genie 3的实验性研究原型「Project Genie」，允许用户通过AI技术创建、编辑和探索虚拟世界。这一项目由图像生成模型Nano Banana Pro和语言模型Gemini提供技术支持，标志着交互式虚拟环境构建的重大进展。Genie 3的核心能力在于实时生成动态路径，模拟物理效果和交互，使场景从机器人技术到历史还原成为可能。

Project Genie的三大核心功能包括：世界草绘——用户通过文本或图像输入创建可自定义的虚拟环境，并整合Nano Banana Pro进行精准调整；世界探索——实时生成可导航的动态路径，支持视角切换；世界重混——基于现有内容生成新版本，用户可下载探索过程的视频。这些功能共同实现了从静态生成到动态交互的跨越。

尽管Genie 3展现出突破性潜力，谷歌坦言其仍存在局限性：生成内容可能存在物理规律偏差、角色控制延迟、时长限制为60秒，且部分预告功能尚未实现。早期测试者反馈显示，模型在游戏场景生成和物理模拟方面表现惊艳，但细节逻辑仍需优化。例如，用户成功创建了「法国女子攀越飞行物体世界」的互动场景，但也观察到「头顶鸭子的水獭飞行员」等非拟真现象。

目前，Project Genie已面向美国成年Google AI Ultra用户开放，用户可通过文本提示生成包括「好莱坞漫步」等高度可控的交互体验。该技术被视作游戏开发、动画建模等领域的潜在变革者，其持续迭代或将重新定义虚拟内容的生产方式。随着模型成熟，实时生成与物理模拟的精度提升将成为下一步发展关键。