单卡2秒生成一个视频!清华联手生数开源TurboDiffusion,视频DeepSeek时刻来了

AIGC动态3小时前发布 QbitAI
61 0 0
单卡2秒生成一个视频!清华联手生数开源TurboDiffusion,视频DeepSeek时刻来了

 

文章摘要


【关 键 词】 生成视频开源框架速度提升清华大学单张显卡

视频生成领域迎来重大突破清华大学TSAIL实验室与生数科技联合开发的TurboDiffusion框架实现了惊人的速度飞跃。该开源框架能够在单张RTX 5090显卡上运行,将5秒480P视频的生成时间从原来的184秒缩短至1.9秒,最高提速达200多倍,引发学术界和产业界广泛关注。

技术实现层面,TurboDiffusion通过四项核心技术突破传统瓶颈:SageAttention2++低比特量化方案将注意力计算速度提升3-5倍;Sparse-Linear Attention算法从逻辑层面减少计算量;rCM步数蒸馏技术将迭代步骤压缩至1-4步;W8A8量化与自定义算子优化则充分利用硬件性能。这些技术协同作用,在不损失生成质量的前提下,使1080P视频生成从900秒降至8秒

实际应用价值显著体现在多个维度。消费级设备上可实现720P视频的秒级生成,云端服务推理成本降低百倍,为实时视频编辑、AI短剧制作等新场景铺平道路。特别值得注意的是,该框架对国产芯片架构显示良好适配性,其核心SageAttention技术已集成至NVIDIA Tensor RT,并在华为昇腾等平台完成部署,被国内外数十家科技企业采用。

这项突破标志着视频生成技术正从实验室走向大规模应用。当生成延迟缩短至人类反应时间范围内,创作工具开始向创意伙伴转变。研究团队公开了项目代码和论文,邀请开发者共同探索实时生成时代的可能性。当前技术演示显示,14B参数的720P图生视频模型仅需38秒,预示着高质量AI视频即将进入日常创作流程。

原文和模型


【原文链接】 阅读原文 [ 1811字 | 8分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...