图像生成

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

张天宇在其研究中提出了一种名为视觉字幕恢复（Visual Caption Restoration, VCR）的新任务，旨在探究视觉语言模型（Vision-Language Models, VLM）的推理能...

AIGC动态

2年前 (2024)

旷视科技近期推出了一款名为MegActor的开源AI人像视频生成框架，该框架允许用户通过输入一张静态肖像图片和一段视频，生成表情丰富、动作一致的AI人像视频。M...

AIGC动态

2年前 (2024)

字节跳动豆包大模型团队近期发布了名为Seed-TTS的语音生成大模型，该模型在生成与真人相似度极高的语音方面取得了显著成果。Seed-TTS能够根据文本生成具有原...

AIGC动态

2年前 (2024)

可灵AI的图生视频和视频续写功能在全球范围内引发了视频创作的热潮。一位网友使用该技术将爷爷的两张老照片还原成视频，不仅为即将接受手术的父亲加油鼓劲，...

AIGC动态

2年前 (2024)

快手大模型团队开发了一种名为I2V-Adapter的新技术，该技术是一种轻量级适配模块，基于Stable Diffusion的文生视频扩散模型。I2V-Adapter能够在不改变现有文...

AIGC动态

2年前 (2024)

视觉Foundation Model成为会议的核心主题之一。两篇最佳论文均颁给了AIGC，图像和视频合成与生成领域的论文数量达到329篇，位居榜首。上海人工智能实验室的Op...

AIGC动态

2年前 (2024)

由姚班天才团队开发的大模型原生应用《我把大模型玩坏了》（下文简称《玩坏了》）在微信小程序上线，提供了一种新颖的互动体验。这款游戏的前身是《完蛋！我...

AIGC动态

2年前 (2024)

日本人工智能初创公司SakanaAI成立不到一年，已获得超过1亿美元的融资，估值达到1800亿日元（约合人民币82亿，11.5亿美元），即将跻身AI独角兽行列。本轮融资...

AIGC动态

2年前 (2024)

快手搜索部门技术专家许坤在QCon 2024北京的分享中，深入探讨了大模型技术在快手搜索领域的应用，特别是多模态理解和生成方面的最新科研进展。许坤介绍了快手...

AIGC动态

2年前 (2024)

何恺明在加入麻省理工学院（MIT）担任副教授后，首次独立带队完成了一项新的研究工作，提出了一种新的图像生成方法。该方法通过让自回归模型抛弃传统的矢量量...

AIGC动态

2年前 (2024)