游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

AIGC动态3小时前发布 AIera
61 0 0
游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

 

文章摘要


【关 键 词】 游戏AI通用操作视觉学习具身智能机器人控制

英伟达开发的NitroGen模型通过观看4万小时带有手柄画面的游戏直播,建立了从视觉输入到操作输出的直接映射。这一突破性方法摒弃了传统AI依赖游戏后台数据的模式,转而模拟人类玩家的学习过程——通过观察屏幕像素与对应的手柄动作来掌握游戏操作。研究人员创新性地利用了直播画面中嵌入的控制器叠加层,将视觉场景与具体按键建立关联,实现了无需代码介入的自主学习。

该模型展现出显著的通用性能力,在1000多款不同类型游戏中表现出色。测试显示,面对全新游戏时,NitroGen的表现比从零训练的模型高出52%,验证了其获得的「游戏直觉」具有跨游戏迁移能力。这种泛化能力类似于人类玩家将既有游戏经验应用于新作品时的认知过程,标志着AI在动作策略学习方面取得重要进展。

在技术实现层面,这一突破与英伟达的GR00T机器人基础模型架构密切相关。虚拟游戏环境被视为物理世界的训练场,游戏中的「感知-决策-行动」闭环为现实机器人控制提供了理想的模拟场景。模型在游戏中学习的「看到悬崖-跳跃回避」机制,可直接类比为机器人「识别障碍-调整步态」的物理控制逻辑,这种对应关系为具身智能发展开辟了新路径。

AI在复杂游戏谜题中展现的推理能力与NitroGen的操作能力相结合,预示着全新的智能范式。The Decoder的研究显示,顶尖模型如GPT-5.2-Thinking已能解构《塞尔达传说》中的多步变色谜题,这种规划能力与NitroGen的运动控制相结合,构成了分层智能架构:高层负责抽象推理,中层转化具体动作,底层执行物理控制。这种架构可能彻底改变人机交互模式,使AI不仅能理解指令,还能自主完成从决策到执行的全过程。

当前技术仍面临触觉反馈缺失、高精度操作限制等挑战。虚拟训练环境缺乏物理交互的真实质感,这要求未来研究需整合多模态感知数据。同时,安全伦理问题也伴随自主能力提升而凸显,需要建立确保AI行为符合人类预期的约束机制。尽管如此,通过游戏世界训练通用智能体的路径已展现出巨大潜力,可能加速实现从专用窄AI向通用具身智能的跨越。

原文和模型


【原文链接】 阅读原文 [ 3272字 | 14分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...