视频生成

视频,video

三大模态模型全部登顶后,昆仑万维正式披露了 2026 年 AGI 战略

昆仑万维在2026年正式对外披露其“3+1”生态架构,标志着公司从早期的单点技术突破迈向系统性AI平台化布局。该架构以四大SOTA大模型为底层支撑:Matrix-Game 3....

深扒 50+被投科技企业背后,美团的 AI 版图

美团在AI浪潮中采取了前瞻性、系统性且低调务实的科技布局策略,其核心逻辑并非追求单一技术爆款或大模型叙事,而是聚焦于构建支撑“物理世界AI底座”的执行能...

多Agent 狂吞token,Claude 顶不住了:一人月烧15万美元,免费AI正在退场

Anthropic团队正以极高强度内部试用Claude Code,过去52天内推出50多项重大功能更新。据社交媒体信息,80%的Anthropic员工每日使用该工具,高频用户账单已达...

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

本文系统性地介绍了视频多模态大模型实现“主动交互”的最新研究进展,聚焦于北京大学王选计算机研究所发布的ProactiveVideoQA与MMDuet2两项关键工作。核心目标...

这是近几年百度最打动我的 AI 产品。

本文围绕百度新推出的DuMate产品展开,重点探讨其作为“AI搭子”角色在个人与团队工作场景中的实际应用价值。文章开篇即肯定该产品的设计感与理念先进性,将其...

AI 为什么不会规划?Yann LeCun团队:问题出在「时间是弯的」

本文探讨了构建具备世界建模与规划能力的AI系统所面临的核心挑战,聚焦于潜在空间中时间轨迹的几何结构问题。研究指出,当前预训练视觉编码器在潜在空间生成...

川大雷印杰团队论文:用现实物理规律「重写」视频生成方式丨CVPR 2026

研究采用CogVideoX-5B作为基础生成模型,结合GPT-OSS-20B进行语言推理,Qwen-Image负责关键帧生成。流程包括文本理解→物理规律识别→事件分解(如蜂蜜倒入分为...

马斯克说“更多人该来中国看看”,那不妨直接来海淀

当前中国科技发展正经历显著转变,外部世界对中国的观察从“样本”转向“场域”,尤其以北京海淀为代表的区域成为全球技术竞争中的关键节点。海淀不再仅是被动被...

专访中科第五纪黄岩:在具身智能的狂热中,做一位技术实干家

在2026年具身智能热潮中,黄岩作为中科院自动化所研究员与中科第五纪青年首席科学家,以其兼具学术深度与工程落地能力的全栈技术路径,为行业突破数据利用瓶...

中山大学梁小丹团队论文:让视频生成从「看起来真实」到「物理上正确」丨CVPR 2026

ProPhy 方法致力于提升视频生成模型在物理一致性方面的表现,使其不仅在视觉上逼真,更在物理逻辑上可信。当前视频生成模型虽已大幅提高图像质量,但在动态交...
1 2 3 252