图像生成
图像,绘画
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水平和垂直墙生成迷宫,...
谷歌推出多模态视频模型,自动生成丰富动作视频
文章摘要 【关 键 词】 AIGC、多模态模型、VLOGGER、视频生成、技术创新 随着数字化经济的蓬勃发展,虚拟数字人的需求在各行业中日益增长。为了...
a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态
Adam D'Angelo,Meta的前CTO和Quora的CEO,目前还是OpenAI的董事会成员。他最近推出了Poe,这是一个集成了多个大型语言模型(LLMs)的聊天机器人平台,包括GP...
这些公司,是怎么用亚马逊云科技的生成式 AI 横扫海外的
在2024年,中国企业面临的最重要增长机遇是「走向海外」。TCL创始人李东生的言论「不出海,即出局」凸显了这一点。中国企业的海外业务已成为2023年的主要增长...
“计算机视觉女神”被IEEE期刊封杀
IEEE计算机协会近日宣布,自4月1日起,将不再接收包含Lenna图像的论文。这一决定是基于推动开放、包容和公平文化的承诺,同时也尊重了照片主体Lena Forsén的...
大模型创业淘汰潮开始了:这是第一个估值10亿美元的祭品
Stability AI,一家曾经在AI领域备受瞩目的初创公司,如今却陷入了严重的财务危机和管理混乱。公司的核心产品Stable Diffusion虽然在AI绘画领域取得了一定的...
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练
随着生成模型的快速发展,如ChatGPT和扩散模型,生成数据的质量不断提高,同时模型规模的增大也导致真实数据的枯竭。这引发了学界的争论,即生成模型生成的假...
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
DeepMind的最新研究成果SIMA,一个多世界AI代理,标志着AI在游戏领域的又一重大进展。SIMA不仅能够在多种视频游戏中执行任务,而且它的操作方式与人类相似,...
国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI
新智元报道了一家名为“阶跃星辰”的初创公司在2024全球开发者先锋大会上发布了三个大型模型:Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型和Step-2...
文本直接生成2分钟视频,即将开源模型StreamingT2V
文章摘要 【关 键 词】 AIGC、大语言模型、视频生成、技术创新、StreamingT2V 近年来,人工智能生成内容(AIGC)领域取得了显著进展,特别是在大...