国产AI视频炸了!SkyReels-V3三大功能重磅开源,1张图生成逼真视频

AIGC动态2小时前发布 AIera
65 0 0
国产AI视频炸了!SkyReels-V3三大功能重磅开源,1张图生成逼真视频

 

文章摘要


【关 键 词】 AI视频多模态生成开源模型影视创作电商广告

昆仑天工SkyworkAI团队开源的多模态视频生成模型SkyReels-V3,在参考一致性、视频质量和功能集成上实现了突破性进展。该模型通过单一架构整合三大核心能力:参考图像转视频、视频延长和音频驱动虚拟形象,显著降低了专业级视频制作的门槛。测试数据显示,其参考一致性得分达0.6698,视觉质量0.8119,超越主流商业模型表现。

参考图像转视频功能允许用户通过1-4张图片和文本指令生成多主体连贯视频。电商场景中,商品主图、模特展示图和品牌Logo可快速合成高保真广告,确保主角身份、商品细节和场景逻辑的高度统一。技术团队构建的200组测试基准显示,模型能有效避免传统AI视频中常见的角色形变和场景跳变问题。

视频延长功能突破性地实现了5秒素材扩展至30秒的能力,并内置5种专业转场效果。通过”统一多分段位置编码”技术,模型能理解视频的时空逻辑,生成镜头语言自然的延长片段。测试案例显示,骑行视频延长后主体与背景保持稳定,多角度对话场景切换流畅,解决了素材不足的行业痛点。

音频驱动虚拟形象功能支持真人、卡通、动物等各类图像分钟级生成。基于音素级同步技术,模型实现8.18分的音视频同步性,支持720p高清输出。特别值得注意的是多人对话场景的突破,系统能自动识别不同音频对应的角色,实现自然的说话-聆听状态切换。

作为完整开源项目,SkyReels-V3提供GitHub代码库和限时免费API,支持本地部署和商业改造。其技术文档的完整性和易用性,使中小团队能零成本获得顶级AI视频能力。开发者可将模块集成到脚本生成、素材管理等现有工作流中,推动AI视频生态的持续进化。

该模型标志着视频生成技术从实验阶段迈向实用化阶段。影视制作、电商广告、教育内容等领域将直接受益,传统需要专业设备和技术人员的视频生产流程,现在可通过AI实现降本增效。团队透露,未来版本将继续优化长视频稳定性,并探索更复杂的多模态交互功能。

原文和模型


【原文链接】 阅读原文 [ 2635字 | 11分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...