图像生成

图像,绘画

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥大学信息工程系人工智能实验室最近开源了首个预训练、通用多模态后期交互知识检索器PreFLMR。该模型基于Fine-grained Late-interaction Multi-modal Retr...

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

这篇文章介绍了日本大模型公司提出的一种新颖的模型合并方法,旨在自动生成新的基础模型而无需进行梯度训练。他们使用进化算法引入了“进化模型合并”(Evoluti...

Sora场景转「3D资产」!浙大CAD&CG全重实验室提出文本转3D新SOTA:多功能、可拓展

新智元报道了一种名为3D-SceneDreamer的新型3D场景生成工具,该工具采用基于Stable Diffusion的Inpainting模型,结合单目深度方法,以优化场景的三维结构。3D...

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰是一家国内通用大模型创业公司,于 2024 年全球开发者先锋大会上发布了公司的通用大模型产品。公司创始人兼 CEO 姜大昕博士在发布会上介绍了 Step 系...

OpenAI进军好莱坞:电影制作用Sora指日可待

  文章摘要 【关 键 词】 OpenAI、视频生成、人工智能、好莱坞、合作关系 OpenAI最近展示了其自动生成视频的Sora,引起了好莱坞和硅谷的关注。 公...

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

何恺明的目标是探索面向复杂世界的智能。Sora是首个引起广泛关注的大规模通用视频生成模型,自OpenAI于2024年2月推出以来,没有其他视频生成模型能在性能或支...

突发!Stability AI的CEO,跑路了

2024年第一季度,生成式AI明星公司Inflection和Stability AI相继倒闭,Stability AI更是陷入风雨飘摇的状态。周六上午,Stability AI突然宣布CEO Emad Mostaq...

3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

这篇新智元报道介绍了一种名为3D-VLA(3D视觉-语言-动作)的新型生成式视觉-语言-行动模型,该模型在多项任务中显著提高了推理、多模态生成和规划的能力。与...

算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室

这篇文章是关于AI大模型在文生图领域的测评。作者选择了四个模型:文心一格、360智绘、美图MiracleVision 4.0和GPT-4,通过同题多解的方式,逐一测评了它们的...

微软开源创新LoRA组合方法,增强文生图复杂细节控制

该文章介绍了微软和伊利诺伊大学研究人员开发的Multi-LoRA Composition方法,旨在解决在图像合成中应用多个LoRA时出现的图像失真和难以控制细节的问题。该方...
1 94 95 96 97 98 122