
文章摘要
【关 键 词】 视频生成、AI技术、谷歌更新、音画同步、电影质感
谷歌凌晨发布了视频生成模型Veo 3.1的重大更新,标志着AI视频生成进入导演级精控阶段。此次升级聚焦两大核心功能:叙事与音频控制的强化,以及输入与编辑能力的扩展。新版本通过Gemini API和Vertex AI的接入,使普通用户可通过Flow平台或Gemini直接体验,目前已支持生成最长148秒、1080p/24fps规格的视频。
在技术实现上,Veo 3.1展现出三大突破性能力:首尾帧与多图参考控制允许用户通过首尾画面描述生成连贯场景;多人物场景合成可将不同照片整合为带音频的动态画面;片段延续技术基于前一视频末帧生成后续内容,保持叙事一致性。测试显示,即使使用”威尔斯吃面”等极简提示词,生成的视频也能呈现自然流畅的效果。
配套平台Flow展现出强大的生态潜力,用户已累计生成2.75亿个视频。新推出的Flow TV功能将海量作品分类为不同主题频道,如”碰撞测试””打招呼”等,同时设有专门展示用户微电影的Short Films专区。目前上线的三部作品中,《FreeLancers》以电影级质感呈现了复杂叙事,验证了技术对长视频叙事的支持能力。
尽管存在原生时长限制(基础8秒)和复杂场景下的物理表现缺陷,但此次更新在音画同步与画质提升方面取得明显进展。值得注意的是,系统能自动延续原始镜头动作,并实现宏大转场效果,这为创作者提供了更自由的表达空间。随着年底Gemini 3系列产品的预期发布,谷歌在AI视频生成领域的技术布局或将迎来更重大的突破。
原文和模型
【原文链接】 阅读原文 [ 921字 | 4分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆