图像生成

图像,绘画

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径

新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水平和垂直墙生成迷宫,...

谷歌推出多模态视频模型,自动生成丰富动作视频

  文章摘要 【关 键 词】 AIGC、多模态模型、VLOGGER、视频生成、技术创新 随着数字化经济的蓬勃发展,虚拟数字人的需求在各行业中日益增长。为了...

a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

Adam D'Angelo,Meta的前CTO和Quora的CEO,目前还是OpenAI的董事会成员。他最近推出了Poe,这是一个集成了多个大型语言模型(LLMs)的聊天机器人平台,包括GP...

这些公司,是怎么用亚马逊云科技的生成式 AI 横扫海外的

在2024年,中国企业面临的最重要增长机遇是「走向海外」。TCL创始人李东生的言论「不出海,即出局」凸显了这一点。中国企业的海外业务已成为2023年的主要增长...

“计算机视觉女神”被IEEE期刊封杀

IEEE计算机协会近日宣布,自4月1日起,将不再接收包含Lenna图像的论文。这一决定是基于推动开放、包容和公平文化的承诺,同时也尊重了照片主体Lena Forsén的...

大模型创业淘汰潮开始了:这是第一个估值10亿美元的祭品

Stability AI,一家曾经在AI领域备受瞩目的初创公司,如今却陷入了严重的财务危机和管理混乱。公司的核心产品Stable Diffusion虽然在AI绘画领域取得了一定的...

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

随着生成模型的快速发展,如ChatGPT和扩散模型,生成数据的质量不断提高,同时模型规模的增大也导致真实数据的枯竭。这引发了学界的争论,即生成模型生成的假...

DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」

DeepMind的最新研究成果SIMA,一个多世界AI代理,标志着AI在游戏领域的又一重大进展。SIMA不仅能够在多种视频游戏中执行任务,而且它的操作方式与人类相似,...

国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

新智元报道了一家名为“阶跃星辰”的初创公司在2024全球开发者先锋大会上发布了三个大型模型:Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型和Step-2...

文本直接生成2分钟视频,即将开源模型StreamingT2V

  文章摘要 【关 键 词】 AIGC、大语言模型、视频生成、技术创新、StreamingT2V 近年来,人工智能生成内容(AIGC)领域取得了显著进展,特别是在大...
1 91 92 93 94 95 122