图像生成
图像,绘画
揭秘千卡 GPU 集群如何高效训练多模态大模型:vivo AI 团队实战经验分享|AICon
多模态大模型在智能客服、自动驾驶、AIGC等领域的应用需求不断增长,但其训练工程面临计算、存储、数据处理、分布式通信等多重挑战。特别是在千卡级GPU训练集...
松下发布多模态大模型,文本、图像、音频随意切换
随着大模型技术的快速发展,多模态数据处理逐渐成为研究热点。多模态生成任务通过整合文本、图像、音频等多种类型的数据,实现不同模态之间的相互转换与生成...
初赛报名截止倒计时!75万奖池+心动Offer,启元实验室重磅赛事等你来战!
随着人工智能技术的快速发展,智能化浪潮正在深刻改变各行各业,中国也迎来了人工智能加速应用的关键时期。为推动智能算法从理论创新走向实际落地,启元实验...
游戏教父 John Carmack:LLM 不是游戏的未来
John Carmack作为游戏开发领域的先驱,回顾了自己在Id Software、Armadillo Aerospace、Oculus和Keen Technologies的职业生涯,并分享了他对人工智能和强化学...
“多模态方法无法实现AGI”
生成式人工智能模型的成功让一些人相信人工通用智能(AGI)即将到来,但这些模型并未真正捕捉到人类智能的本质。它们之所以出现,主要是因为它们能够有效地扩...
CVPR现场直击|华人一作的最佳论文,火热的3D和世界模型以及“无处不在”的何恺明们
2025年CVPR会议在美国田纳西州纳什维尔举办,参会人数继续保持高位,会议性质从纯学术交流转向工业界与学术界互动、AI公司抢夺注意力和人才的行业大聚会。今...
LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代
Meta最新发布的V-JEPA 2世界模型标志着人工智能在理解物理世界方面迈出了重要一步。该模型由Meta首席AI科学家Yann LeCun亲自推广,旨在通过模拟人类对物理世...
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题
豆包大模型1.6作为国内首款多模态SOTA模型,在火山引擎原动力大会上正式亮相。该模型支持256k上下文长度,具备深度思考能力,并首次实现GUI操作功能,形成'视...
火山引擎发布豆包大模型1.6,加速Agent大规模应用
字节跳动旗下火山引擎在Force原动力大会上发布了多项AI技术进展,包括豆包大模型1.6、视频生成模型Seedance 1.0 pro以及升级的AI云原生服务。字节跳动CEO梁汝...
杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑
Meta近期开源了其最新的大模型V-JEPA 2,该模型在多个方面实现了显著的技术突破。V-JEPA 2通过使用100万小时的视频和100万张图像进行超大规模训练,旨在让AI...




