刚刚，谷歌深夜上新Veo 3.1！网友狂刷2.75亿条，Sora 2要小心了

631 0 0

文章摘要

谷歌凌晨发布了视频生成模型Veo 3.1的重大更新，标志着AI视频生成进入导演级精控阶段。此次升级聚焦两大核心功能：叙事与音频控制的强化，以及输入与编辑能力的扩展。新版本通过Gemini API和Vertex AI的接入，使普通用户可通过Flow平台或Gemini直接体验，目前已支持生成最长148秒、1080p/24fps规格的视频。

在技术实现上，Veo 3.1展现出三大突破性能力：首尾帧与多图参考控制允许用户通过首尾画面描述生成连贯场景；多人物场景合成可将不同照片整合为带音频的动态画面；片段延续技术基于前一视频末帧生成后续内容，保持叙事一致性。测试显示，即使使用”威尔斯吃面”等极简提示词，生成的视频也能呈现自然流畅的效果。

配套平台Flow展现出强大的生态潜力，用户已累计生成2.75亿个视频。新推出的Flow TV功能将海量作品分类为不同主题频道，如”碰撞测试””打招呼”等，同时设有专门展示用户微电影的Short Films专区。目前上线的三部作品中，《FreeLancers》以电影级质感呈现了复杂叙事，验证了技术对长视频叙事的支持能力。

尽管存在原生时长限制（基础8秒）和复杂场景下的物理表现缺陷，但此次更新在音画同步与画质提升方面取得明显进展。值得注意的是，系统能自动延续原始镜头动作，并实现宏大转场效果，这为创作者提供了更自由的表达空间。随着年底Gemini 3系列产品的预期发布，谷歌在AI视频生成领域的技术布局或将迎来更重大的突破。