图像生成

图像,绘画

“多模态方法无法实现AGI”

生成式人工智能模型的成功让一些人相信人工通用智能(AGI)即将到来,但这些模型并未真正捕捉到人类智能的本质。它们之所以出现,主要是因为它们能够有效地扩...

CVPR现场直击|华人一作的最佳论文,火热的3D和世界模型以及“无处不在”的何恺明们

2025年CVPR会议在美国田纳西州纳什维尔举办,参会人数继续保持高位,会议性质从纯学术交流转向工业界与学术界互动、AI公司抢夺注意力和人才的行业大聚会。今...

LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代

Meta最新发布的V-JEPA 2世界模型标志着人工智能在理解物理世界方面迈出了重要一步。该模型由Meta首席AI科学家Yann LeCun亲自推广,旨在通过模拟人类对物理世...

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

豆包大模型1.6作为国内首款多模态SOTA模型,在火山引擎原动力大会上正式亮相。该模型支持256k上下文长度,具备深度思考能力,并首次实现GUI操作功能,形成'视...

火山引擎发布豆包大模型1.6,加速Agent大规模应用

字节跳动旗下火山引擎在Force原动力大会上发布了多项AI技术进展,包括豆包大模型1.6、视频生成模型Seedance 1.0 pro以及升级的AI云原生服务。字节跳动CEO梁汝...

杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑

Meta近期开源了其最新的大模型V-JEPA 2,该模型在多个方面实现了显著的技术突破。V-JEPA 2通过使用100万小时的视频和100万张图像进行超大规模训练,旨在让AI...

对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天

在2024年智源大会上,智源研究院发布了'悟界'系列大模型,标志着人工智能技术向物理世界探索的显著进展。原生多模态世界模型Emu3通过统一架构实现了文本、图...

苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理

苹果在WWDC全球开发者大会上推出了新一代专为增强Apple Intelligence功能开发的基座语言模型。该模型家族包括一个约3B参数的紧凑型设备端模型和一个基于服务...

谷歌悄咪咪上线了 10 款 AI 应用,下一个 NotebookLM 可能在里面

Google Labs作为谷歌官方的AI实验平台,已成为生成式AI创新的重要孵化器。该平台近期密集上线了十余款兼具实用性和趣味性的AI工具,涵盖内容创作、生活服务、...

AI大模型重塑学习硬件:从工具到伙伴 | 网易有道孟旭

在AICon全球人工智能开发与应用大会·上海站(2025)上,网易有道词典笔产品负责人孟旭分享了智能学习硬件在大模型技术催化下的变革逻辑。他指出,智能学习硬...
1 2 3 129