这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3

AIGC动态2小时前发布 QbitAI
50 0 0
这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3

 

文章摘要


【关 键 词】 AI视频音视频生成技术突破全球排名影视制作

国产AI视频生成技术Vidu Q3实现了全球首个支持16秒音视频直出的突破。该模型由生数科技推出,能够一次性生成包含画面、台词和音效的完整视频,支持中文、英文和日文等多种语言,并具备1080P清晰度(可提升至4K)。在国际权威AI基准测试机构Artificial Analysis的榜单中,Vidu Q3位列中国第一、全球第二,超越Runway Gen-4.5、Google Veo3.1和OpenAI Sora 2等竞争对手。

Vidu Q3的核心优势在于全自动化的音视频生成能力。用户可以通过图生视频或文生视频两种方式操作,支持1-16秒的时长选择以及多种宽高比例调整。实测显示,模型不仅能精准理解提示词(Prompt)的意图,还能自动补充细节,如弹幕效果、背景音效和镜头转场。例如,在生成真人版《火影忍者》片段时,模型还原了日漫风格;在直播连麦场景中,未提示的情况下自动添加了动态弹幕;而在古装苦情戏中,则自行补足了风声、抽泣声等环境音效。

模型的叙事能力显著提升,尤其擅长多镜头切换和复杂场景还原。测试中,Vidu Q3成功实现了皮克斯风格动画的分镜转换,以及修仙动漫的情绪表达。此外,模型对画面文字的渲染能力(如横幅、黑客帝国风格数字)减少了后期加工需求,进一步贴近影视制作标准。行业观察指出,从Sora引爆的“AI默片时代”到音视频直出,技术进化仅用9个月,远超人类电影史中从默片到有声片的32年历程。

Vidu Q3标志着AI视频生成进入多模态融合新阶段。其16秒一镜到底的能力为短片创作提供了完整叙事框架,而音画时序对齐和多语言支持则降低了内容生产的门槛。目前,用户可通过官网或API体验该技术,注册即赠500积分。随着技术迭代加速,AI视频生成的“啊哈时刻”或将更快到来,推动影视、广告等领域的生产力变革。

原文和模型


【原文链接】 阅读原文 [ 2042字 | 9分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...