标签:视频生成
硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演
2025年标志着视频生成技术进入全新范式,以阿里万相2.6为代表的模型实现了从单点突破到系统级创新的跨越。该模型首次在国内实现声画一致性角色定制,通过多模...
加速200倍,单显卡1.8秒生成5秒高清视频!清华与Vidu解开了视频扩散模型的速度枷锁
TurboDiffusion技术通过稀疏注意力、蒸馏量化和硬件优化,将视频生成速度提升至实时水平。传统视频扩散模型因计算复杂度高而效率低下,尤其在处理时间连贯性...
国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技
近期视频生成技术领域迎来新一轮竞争热潮,谷歌、Runway、快手等科技公司相继推出迭代产品,但实际生产力转化仍是行业痛点。商汤科技发布的Seko 2.0版本通过...
统一视觉多模态与多任务!快手可灵与港科大团队发布视频生成模型,加速真实世界理解
统一多模态多任务的视频生成模型UnityVideo通过整合多种视觉模态,显著提升了模型对物理世界的理解能力和生成质量。该模型由港科大、港中文、清华大学和快手...
多人会话视频生成新突破:香港科技大学,浙江大学用单人数据实现多人交互视频生成
AnyTalker框架通过创新的音频-人脸交叉注意力机制(AFCA)和两阶段训练策略,实现了高质量、可扩展的多人对话视频生成。该技术由香港科技大学、浙江大学等机...
一个能思考、会记忆的AI导演诞生了!新加坡管理大学,香港中文大学等实现故事化视频生成
视频生成领域长期面临工具碎片化的困境,专业模型虽在单一任务上表现优异,但缺乏整合能力。为解决这一问题,新加坡管理大学、香港中文大学和斯坦福大学联合...
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了
谷歌凌晨发布了视频生成模型Veo 3.1的重大更新,标志着AI视频生成进入导演级精控阶段。此次升级聚焦两大核心功能:叙事与音频控制的强化,以及输入与编辑能力...
刷屏的Sora 2,不是“AI抖音”时刻
OpenAI正式推出新一代视频生成模型Sora 2,并将其以独立iOS应用的形式发布,标志着从技术模型向消费级产品的转型。与第一代Sora不同,Sora 2不再局限于ChatGP...
刷屏的Sora 2,不是“AI抖音”时刻(附邀请码)
OpenAI正式推出新一代视频生成模型Sora 2,并将其以独立iOS应用的形式发布,标志着从技术模型向消费级产品的转型。Sora应用在美国和加拿大率先上线,采用邀请...





