视频生成
视频,video
当世界模型开始“指挥双手”,蚂蚁灵波的具身路线更清晰了
蚂蚁旗下的灵波科技近期密集发布了多项具身智能领域的重要成果,展示了其在该领域的技术布局与生态野心。LingBot-World和LingBot-VA两款开源世界模型的发布,...
马斯克还在卷10秒,中国AI直接掀桌!16秒一镜到底,全球唯一
硅谷巨头与中国AI在视频生成领域的竞争进入白热化阶段,Vidu Q3的发布标志着行业进入'视听生成'新时代。这款由中国团队开发的下一代旗舰模型,以'声画同出,...
字节阿里DeepSeek决战春节:一场关乎14亿人的重磅AI大战
中国科技巨头正围绕春节这一关键时间节点展开激烈的AI技术竞赛与市场争夺。字节跳动、阿里巴巴和DeepSeek三大企业以差异化技术路线角逐14亿用户的生活入口,...
谷歌开放世界模型一夜刷屏,AI游戏门槛归零时刻来了?
谷歌DeepMind近期开放了世界模型Genie 3的实验性研究原型「Project Genie」,允许用户通过AI技术创建、编辑和探索虚拟世界。这一项目由图像生成模型Nano Bana...
这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3
国产AI视频生成技术Vidu Q3实现了全球首个支持16秒音视频直出的突破。该模型由生数科技推出,能够一次性生成包含画面、台词和音效的完整视频,支持中文、英文...
模力工场 030 AI 应用榜:字节新品硬刚 Sora,“随变”登顶榜首
模力工场本周聚焦AI增效流水线,展示从信息到作品的智能生产工作流,涵盖智能阅读、研报生成、记忆管理和视觉设计全流程。这套系统能将碎片信息快速整合为结...
超越 Sora2,Vidu Q3 以 16 秒声画同出开创视频创作新范式
Vidu Q3的出现标志着AI视频生成技术进入新阶段,其核心突破在于实现了16秒内声画同步的完整叙事能力。传统AI视频生成往往需要后期配音且画面割裂,而Vidu Q3...
实测Genie:各位,传说中的世界模型被Google做出来了
Google DeepMind近期向公众开放了Project Genie的实验性研究原型,这是世界模型Genie 3首次以可交互形态对外展示。该原型目前仅限美国18岁以上的Google AI Ul...
昆仑万维多模态视频生成开源,影音图文全统一
昆仑万维开源的SkyReels-V3通过统一的多模态上下文学习框架,在单一模型中实现了参考图像生成视频、视频持续扩展以及音频驱动的虚拟数字人三大核心功能。该模...
具身导航:感知推理是上帝,还是执行控制是命门?| GAIR Live 023期预告
具身智能导航技术正经历从传统几何避障向高阶空间智能的跨越式发展。导航不再局限于路径规划,而是融合视觉感知、空间推理与实时决策的系统性挑战,这一变革...




