一个全新的世界模型，终于让AI视频进入了“无限流”时代。

276 0 0

文章摘要

PixVerse公司深夜发布了名为R1的下一代实时世界生成模型，该项目通过连续视频流和即时Prompt干预实现了动态剧情演化。官方演示显示，用户可通过文字指令在2秒延迟内改变视频进程，如从”士兵躺雪山”转为”乌鸦飞过”，再到”巡逻队发现士兵”。系统默认状态下可实现无限连续的视觉流传输，这种“实时世界生成”技术突破了传统视频生成的单向性。

当前世界模型领域主要存在三大技术路线：Google的Genie 3代表动态视频世界模型，支持文本生成可导航的分钟级一致性视频；李飞飞团队的Marble聚焦3D空间重建，强调三维环境中的多模态交互；英伟达Cosmos则专攻物理仿真，为自动驾驶等提供高保真训练环境。PixVerse R1填补了第四种可能性——实时视频生成交互系统，其测试版提供六个预设模板，采用邀请制访问。

实际体验揭示了该技术的独特魅力：卡通模板中永动奔跑的双脚、1944年战场突变卡皮巴拉的荒诞转折、赛博朋克场景的即兴演化，都展现出算法不可预测的娱乐性。语音交互模式有效解决了打字延迟的痛点，而自定义功能更实现了《无人深空》式科幻探索和街霸格斗等创意场景。虽然生成质量仍有提升空间，但实时演算带来的参与感创造了全新的娱乐形态。

技术演示暗示了未来内容生产的颠覆性可能：影视游戏或进化为永续演化的世界线，创作者仅需设定初始条件，观众通过微干预衍生个性化剧情分支。这种模式既保留了集体叙事的公共性，又赋予个体改变叙事的权力，在算法随机性与人类控制欲之间建立了新型平衡。尽管大规模创作普及尚存障碍，但R1项目已清晰勾勒出人机协同叙事的雏形，其技术路径可能重新定义数字娱乐的边界。