标签:世界模型
LeCun预言成真!790年长视频,炼出最强开源「世界模型」
人工智能领域迎来重大突破,北京智源研究院发布多模态原生世界模型Emu3.5。这款340亿参数的模型基于790年长视频数据训练,采用自回归架构实现多模态理解与生...
语言模型之后,智源 EMU3.5 找到了 AI 的「第三种 Scaling 范式」
智源研究院发布的「悟界 EMU3.5」多模态世界大模型,标志着人工智能从语言学习向多模态世界学习演进的新阶段。在当前大语言模型文本能力逐渐触顶的背景下,多...
L4大方向有了:理想自动驾驶团队,在全球AI顶会上揭幕新范式
人工智能技术正经历从依赖人类生成数据向体验式学习的范式转变,这一趋势在自动驾驶领域尤为明显。OpenAI前研究员姚顺雨提出AI已进入“下半场”,强调需要开发...
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
北京智源人工智能研究院最新发布的悟界·Emu3.5标志着开源原生多模态世界模型的重大突破。该模型以34B参数量实现图、文、视频任务的统一处理,其核心突破在于...
智源悟界 · Emu3.5 重塑世界模型格局:首提多模态 Scaling 范式,AI 理解世界再进化
北京智源人工智能研究院发布了大规模多模态世界模型“悟界·Emu3.5”,该模型在模拟复杂物理世界方面展现出惊人的逼真度,并揭示了“多模态Scaling范式”的存在。...
刚刚,最佳VLA模型GigaBrain-0开源:世界模型驱动10倍数据,真机碾压SOTA
国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0正式发布。该模型由极佳视界与湖北人形机器人创新中心联合开发,标志着通用机...
Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式
2025年秋季的具身智能领域正经历重大技术突破,特斯拉Optimus 2.0量产与英伟达物理AI全栈方案的发布,揭示了行业核心矛盾:数据问题已成为制约具身智能发展的...
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...
LeCun怒揭机器人最大骗局,坦白Llama与我无瓜!
Meta首席AI科学家Yann LeCun在MIT演讲中尖锐指出,当前人形机器人行业距离实现真正智能仍有巨大差距。他揭示了行业核心困境:尽管工厂场景下的特定任务可通过...
“AI教母”李飞飞的全新世界模型问世!一张英伟达AI芯片就能生成无限3D世界
李飞飞团队的最新研究成果RTFM(Real-Time Frame Model)标志着生成式世界模型技术取得重大突破。该模型基于大规模视频数据训练,能够通过输入1张或多张2D图...



