视频生成

视频,video

AI看不到的爱心,成了最棒的AI检测器。

一张看似简单的视觉错觉图引发了关于AI与人类视觉差异的深度思考。当人们能够轻易识别出图中'左右横跳'的爱心时,主流AI模型却无一例外地将其误判为静态噪点...

对话VideoTutor:用AI打造一个理科版多邻国

硅谷学生创业团队VideoTutor凭借'一句话生成AI视频讲解'技术,在AI教育赛道创下1100万美元种子轮融资纪录。这个仅6人的团队由辍学生Kai Zhao和前谷歌工程师Ja...

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

AI视频技术从极客专属到全民可用的跨越,标志着生成式AI进入新阶段。2025年第四季度,OpenAI的Sora 2与阿里的Wan2.5-Preview两大模型引发全球热潮,前者通过'...

Wan2.2-Animate又火了,5分钟让抠脚大汉秒变高冷女神。

阿里开源模型Wan2.2 Animate近期因生成高精度换脸视频引发广泛关注。该技术通过结合静态人物图像与动态参考视频,能精准复刻表情和动作,甚至支持声音替换,...

德明利亮相安博会,推出面向智能安防的多维度存储解决方案

深圳CPSE安博会于10月28日在福田会展中心开幕,聚焦AI与大数据的智能安防创新。德明利展示了针对高清视频、多路流与AI分析场景的全链路存储解决方案,满足智...

世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

北京智源人工智能研究院最新发布的悟界·Emu3.5标志着开源原生多模态世界模型的重大突破。该模型以34B参数量实现图、文、视频任务的统一处理,其核心突破在于...

智源悟界 · Emu3.5 重塑世界模型格局:首提多模态 Scaling 范式,AI 理解世界再进化

北京智源人工智能研究院发布了大规模多模态世界模型“悟界·Emu3.5”,该模型在模拟复杂物理世界方面展现出惊人的逼真度,并揭示了“多模态Scaling范式”的存在。...

刚刚,智源悟界·Emu3.5登场,原生具备世界建模能力

北京智源人工智能研究院发布了其多模态系列模型的最新力作——悟界・Emu3.5,被定义为“多模态世界大模型”。这一模型通过在超过10万亿的多模态Token上进行端到端...

理想智驾逆袭往事:端到端的百日冲刺

李想在2024年3月的春季战略会上对自动驾驶团队发出严厉警告,要求必须转向端到端技术路线,否则团队将面临重组。这一指令源于理想智驾长期处于行业追赶状态,...

全球首个具身智能开放平台来了!让大模型长出“身体”,像人一样自然表达交互

魔珐科技发布了全球首个面向开发者的具身智能3D数字人开放平台——魔珐星云,该平台旨在为大语言模型和AI智能体赋予身体和表达能力,实现自然的多模态交互。通...
1 44 45 46 47 48 258