图像生成

图像,绘画

旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包

旷视科技近期推出了一款名为MegActor的开源AI人像视频生成框架,该框架允许用户通过输入一张静态肖像图片和一段视频,生成表情丰富、动作一致的AI人像视频。M...

耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘

字节跳动豆包大模型团队近期发布了名为Seed-TTS的语音生成大模型,该模型在生成与真人相似度极高的语音方面取得了显著成果。Seed-TTS能够根据文本生成具有原...

快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅

可灵AI的图生视频和视频续写功能在全球范围内引发了视频创作的热潮。一位网友使用该技术将爷爷的两张老照片还原成视频,不仅为即将接受手术的父亲加油鼓劲,...

快手开源 I2V-Adapter,即插即用、轻量级模块让静态图像秒变动态视频

快手大模型团队开发了一种名为I2V-Adapter的新技术,该技术是一种轻量级适配模块,基于Stable Diffusion的文生视频扩散模型。I2V-Adapter能够在不改变现有文...

视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击

视觉Foundation Model成为会议的核心主题之一。两篇最佳论文均颁给了AIGC,图像和视频合成与生成领域的论文数量达到329篇,位居榜首。上海人工智能实验室的Op...

姚班天才组队开发《完蛋!我被大模型包围了》续作!专为工作日摸鱼爱好者打造

由姚班天才团队开发的大模型原生应用《我把大模型玩坏了》(下文简称《玩坏了》)在微信小程序上线,提供了一种新颖的互动体验。这款游戏的前身是《完蛋!我...

团队15人,估值80亿

日本人工智能初创公司SakanaAI成立不到一年,已获得超过1亿美元的融资,估值达到1800亿日元(约合人民币82亿,11.5亿美元),即将跻身AI独角兽行列。本轮融资...

揭秘大模型技术在快手搜索的应用

快手搜索部门技术专家许坤在QCon 2024北京的分享中,深入探讨了大模型技术在快手搜索领域的应用,特别是多模态理解和生成方面的最新科研进展。许坤介绍了快手...

何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与

何恺明在加入麻省理工学院(MIT)担任副教授后,首次独立带队完成了一项新的研究工作,提出了一种新的图像生成方法。该方法通过让自回归模型抛弃传统的矢量量...

谷歌推出基于Transformer的创新技术——无限注意力

随着生成式AI产品如ChatGPT和Sora等的流行,Transformer架构已成为处理文本、图像、视频和音频等数据的大型语言模型(LLM)的基础。谷歌提出了一种名为Infini...
1 101 102 103 104 105 157