图像生成

图像,绘画

免费AI “神器”第十四弹:Sora竞品可生成2分钟视频;谷歌Vlogger能让图像说话 | 钛媒体AGI

本文介绍了近期生成式人工智能(AIGC)领域涌现的五款创意十足的新应用。首先是由Picsart AI Research、UT Austin和Shi Labs共同开发的120秒超长AI视频模型St...

人在B站,要被AI公司们挤爆了

随着人工智能技术的快速发展,AI大模型公司们已经将营销战场转移到了社交媒体平台,尤其是以年轻用户为主的B站。这些公司通过各种创新的广告投放方式,如视频...

刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源

这篇文章介绍了由香港中文大学终身教授贾佳亚团队提出的多模态模型 Mini-Gemini,被称为绝绝子,相当于开源社区的 GPT4+DALLE3 的王炸组合。Mini-Gemini提供...

北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token

这篇文章介绍了北大和字节跳动合作开发的新方法——Visual Autoregressive Modeling(VAR),旨在改进图像生成的质量和效率。VAR采用了预测下一级分辨率的方式...

AI手机的未来,苹果和谷歌选择走同一条路

苹果公司近期发布了一篇论文,介绍了名为Ferret UI的新模型,这标志着智能手机操作系统可能迎来重大变革。Ferret UI模型基于苹果的Ferret多模态模型,特别擅...

马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

自2023年11月首次亮相以来,马斯克的公司在大模型领域不断取得进步,推出了,这是一个多模态模型,能够理解文本并处理文档、图表、截图和照片中的内容。Grok-...

清华大学获芯片领域重要突破!研制全球首款大规模光芯片,成果登Science

AI的进步和发展正面临着对计算芯片性能和能效的双重挑战。特别是在追求通用人工智能(AGI)的过程中,对计算设备的要求更是严苛。OpenAI的首席执行官Sam Altm...

埋头钻研一年后,阶跃星辰交出了第一份答卷

在去年的百模大战之后,大模型的落地应用逐渐成为了主流。阶跃星辰,这家初创公司虽然在去年底才浮出水面,但其背后的实力不容小觑。公司由前微软NLP专家姜大...

GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式

  文章摘要 【关 键 词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范式「VAR: Visual Auto ...

剑指Sora!120秒超长AI视频模型免费开玩

近日,Picsart AI Research 团队联合发布了一款名为 StreamingT2V 的 AI 视频生成模型,该模型能够生成长达1200帧、时长为2分钟的视频,这在AI视频生成领域是...
1 97 98 99 100 101 134