视频生成

视频,video

CVPR 2026 三维视觉趋势梳理:从 RGB 感知,到真实世界建模

计算机视觉研究正从单纯依赖RGB外观表征,转向对三维结构、跨视角一致性、时间动态和观察过程的综合建模,以推动视觉模型具备更强的空间推理能力,从而更好地...

北京具身大脑供应商,又融资数亿元!

中科第五纪宣布完成数亿元A轮融资,由孚腾资本领投,多家机构及老股东跟投。至此,该公司在今年内已顺利完成三轮大额融资,累计融资金额达数亿元。本轮所获资...

从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

斯坦福教授李飞飞在近期多次深度访谈中明确提出,空间智能是人工智能发展的下一个核心前沿。当前主流的大语言模型本质上是一种存在信息损失的编码方式,若人...

英伟达CPU,太猛了,前所未见!

NVIDIA推出的Vera数据中心CPU采用自主设计的Olympus核心,专为智能AI和现代数据中心工作负载打造。该处理器配备88个核心与176个线程,支持Armv9.2指令集,并...

真可用!美团数字人模型开源,MV、电商等统统拿下

美团开源的数字人视频生成框架 LongCat-Video-Avatar 更新至1.5版本,在生成质量与推理效率上实现显著突破。该版本将音频编码器替换为 Whisper-Large,大幅提...

我找到了创作领域的 Claude Code。

OmniWork是一款以AI Expert Agent为核心理念的创作类人工智能产品,其关键创新在于将各行业专家的实战经验固化到智能体中,使其具备专业的行业认知与操作能力...

性能超越李飞飞,他们把10亿高斯点的3D世界装进浏览器

互联网信息载体正经历从二维向可交互三维的实质性跨越式发展。在过去数十年中,受限于数据传输带宽与终端算力,线上内容只能以图文及视频形式对现实进行降维...

用了一个月,我终于明白华为为什么不做 Pura 90 Ultra

华为Pura 90 Pro与Pro Max机型取消了原有Ultra分级,转而采用差异化显著的双轨布局。外观层面,标准版保留哑光纹理以降低附着率,Pro Max首次在量产结构件上...

本周AI项目推荐 :逆矩阵、Manifold、Liber AI…又一批世界模型公司冒了出来

世界模型旨在赋予人工智能理解物理规律的能力,填补大语言模型在重力、碰撞与因果关系等物理直觉上的认知盲区,使系统能够在执行动作前于内部环境中预演结果...

LeCun 10亿押注的方向,全球领先视觉大模型团队早已布局

随着人工智能加速向物理世界延伸,智能体的核心任务已从单纯的环境感知转向对动态时空的预见与复杂决策。视启未来团队在此背景下重点布局隐空间世界模型技术...
1 2 3 264