
文章摘要
【关 键 词】 AI视频、参考生功能、视频延长、APP改版、社交互动
Vidu Q2「参考生」功能正式上线,标志着AI视频生成技术迈入新阶段。该功能在保持高一致性的基础上,实现了生成速度提升3倍和价格优化,同时首次推出「视频延长」功能,最长可扩展至5分钟。这一突破性进展不仅提升了视频创作的灵活性,还为复杂叙事和长镜头效果提供了技术支持。
在实测表现中,Vidu Q2展现了卓越的镜头控制能力和语义理解深度。它支持同时参考7个图像,并能引用风格、特效等多种类型生成视频。人物动作、表情和运镜效果显著提升,支持延时、航拍、鸟瞰镜头等多种控制方式。例如,通过简单提示词即可生成复杂的瑜伽动作视频,体现了模型对物理理解的精准把握。此外,新增的音视频直出功能结束了「默片」时代,进一步增强了用户体验。
多主体一致性成为Vidu Q2的另一大亮点。无论是经典动画角色与现代风格的结合,还是广告、电商场景的商品对比,模型均能保持前后一致性。与同类产品如Sora 2和谷歌Veo 3.1相比,Vidu Q2在参考图生成和细节处理上更具优势。例如,在相同提示下,Vidu生成的背景与原始图片高度一致,而Veo 3.1则表现出明显的偏离。
视频延长功能的推出解决了AI视频「戛然而止」的痛点。用户可通过自定义延长片段或上传图片扩展尾帧,实现从片段到完整叙事的逻辑闭环。这一功能不仅支持复杂的光影和细节表现,还能精准推演画面逻辑,确保故事流畅自然。免费用户可生成30秒视频,付费用户则能扩展至1/3/5分钟,满足不同创作需求。
Vidu APP的全面改版将创作与社交深度融合。新版本内置热门主体库,支持用户通过简单操作快速生成视频,同时提供合拍玩法,鼓励与好友共创内容。这一设计借鉴了社交平台的互动模式,使创作不再是孤立行为,而是全民参与的社交活动。
总体来看,Vidu Q2通过技术升级和功能创新,推动了AI视频从实验性工具向实用化生产力工具的转变。其在一致性、可控性和社交互动方面的突破,为行业树立了新标杆,预示着AI视频「演技时代」的全面到来。
原文和模型
【原文链接】 阅读原文 [ 3014字 | 13分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★