图像生成

图像,绘画

ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计

斯坦福大学的研究者提出了一种名为“潜在透明度”的方法,使得大规模预训练的潜在扩散模型能够生成透明图像以及多个透明图层。这一进展与市场对分层内容生成的...

解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品

这篇研究综述由理海大学和微软研究院的华人团队发布,深入分析了Sora模型的技术细节、应用前景和局限性。Sora是一个基于扩散模型和Transformer架构的视频生成...

Sora的第一波受害者已经出现

本文主要介绍了四个与AI相关的主题:DignifAI工具、Sora付费专栏、中美AI两大巨头以及Sora内测。首先,文章提到了一个名为DignifAI的新AI工具,它专门用于为...

大模型的发展方向,Chatgpt?AI Agent?两万字深度思考!

本文是李博杰在知乎分享的关于AI Agent的全面介绍和总结。文章首先回顾了ChatGPT发布两年来的发展,特别是大模型从文字对话扩展到文生视频的能力。作者分享了...

阿里最新图生视频模型效果好得可比肩 Sora,但 0 代码“假”开源让国内外网友骂翻了天?

阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图生视频模型。这个模型能够根据用户提供的一张照片和音频文件生成具有丰富面部表情和头部姿态的视频。EMO...

判了!AI侵权全球第一案,奥特曼赢!让我们继续相信光:-)

摘要:广州互联网法院近日作出一项具有里程碑意义的判决,这是全球首例生成式AI图片侵犯著作权案件。案件中,奥特曼版权代理商起诉一家提供AI对话及绘画功能...

能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了

摘要:2023年,多模态大语言模型(MLLM)在文本、代码、图像、视频等领域取得了显著进展。上海人工智能实验室联合多所大学发布了一份详尽的评测报告,对GPT-4...

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

SnapChat背后的公司Snap联合特伦托大学等机构发布了一款名为Snap Video的文本生成视频模型。该模型采用了可扩展的时空Transformer架构,旨在提高视频生成的质...

微软37页论文逆向工程Sora,得到了哪些结论?

摘要:本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频的模型,它在视觉质量...

ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660 Star

LayerDiffusion 是ControlNet作者最新提出的一种方法,它允许大规模预训练的潜在扩散模型(如Stable Diffusion)生成透明图像。这项技术通过在潜在图像上添加...
1 105 106 107 108 109 122