标签:视频生成
多人会话视频生成新突破:香港科技大学,浙江大学用单人数据实现多人交互视频生成
AnyTalker框架通过创新的音频-人脸交叉注意力机制(AFCA)和两阶段训练策略,实现了高质量、可扩展的多人对话视频生成。该技术由香港科技大学、浙江大学等机...
一个能思考、会记忆的AI导演诞生了!新加坡管理大学,香港中文大学等实现故事化视频生成
视频生成领域长期面临工具碎片化的困境,专业模型虽在单一任务上表现优异,但缺乏整合能力。为解决这一问题,新加坡管理大学、香港中文大学和斯坦福大学联合...
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了
谷歌凌晨发布了视频生成模型Veo 3.1的重大更新,标志着AI视频生成进入导演级精控阶段。此次升级聚焦两大核心功能:叙事与音频控制的强化,以及输入与编辑能力...
刷屏的Sora 2,不是“AI抖音”时刻
OpenAI正式推出新一代视频生成模型Sora 2,并将其以独立iOS应用的形式发布,标志着从技术模型向消费级产品的转型。与第一代Sora不同,Sora 2不再局限于ChatGP...
刷屏的Sora 2,不是“AI抖音”时刻(附邀请码)
OpenAI正式推出新一代视频生成模型Sora 2,并将其以独立iOS应用的形式发布,标志着从技术模型向消费级产品的转型。Sora应用在美国和加拿大率先上线,采用邀请...
可灵AI升级模型降价30%,视频大模型会卷入价格战吗?
9月23日,可灵AI推出视频生成可灵2.5 Turbo模型,更新文生视频、图生视频两大功能,官方将“相比2.1模型同档位便宜近30%”作为核心卖点,这是其少见地重点提出“...
百万特效太贵?18张图,百度MuseSteamer直出电影成片
百度最新发布的视频生成模型MuseSteamer标志着国内首个支持声画同步的视频生成技术的诞生。该模型支持最长10秒、最高1080p分辨率的视频生成,并推出Turbo、Li...
拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
MiniMax最新发布的Hailuo 02视频生成模型在全球范围内引发关注,其技术表现与成本优势成为核心亮点。该模型在Artificial Analysis评测中超越谷歌Veo 3和快手K...
一块4090搞定实时视频生成!Adobe黑科技来了
近年来,视频合成技术取得了显著进展,但实时生成高质量视频仍然面临挑战。基于双向注意力机制的扩散 Transformer(DiT)能够生成复杂的时序动态内容,但其非...






