图像生成

图像,绘画

他用豆包和文心一言们做出的这款游戏,被万人追捧|对话游戏创作者银河电灯

《大学生登山失踪事件》是一款以网页解谜为核心玩法的独立游戏,其独特之处在于完全由非技术背景的创作者银河电灯借助AI工具独立完成。游戏通过模拟饭店官网...

刷新SOTA高出19.05分!英伟达开源OmniVinci全模态理解模型,只用1/6的数据,实现全方位超越

英伟达研究团队推出的OmniVinci全模态理解大语言模型,通过创新的架构设计和数据策略,仅用六分之一训练数据便在关键基准测试中超越现有顶尖模型19.05分。该...

特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线

特斯拉自动驾驶副总裁Ashok Elluswamy在计算机视觉顶会ICCV上展示了其世界模拟器技术,该技术能够生成高度真实的驾驶场景视频,用于自动驾驶模型的训练和评估...

美团视频生成模型来了!一出手就是开源SOTA

美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...

东方晶源:三大创新点工具破解先进制程良率瓶颈

随着芯片工艺向先进节点快速演进,制程技术逼近物理极限,设计与制造环节的协同难度显著加大。图形化(Patterning)相关的系统性良率损失已成为制约晶圆厂研...

超越谷歌Banana,字节联合香港中文大学等高校开源最强图像编辑生成系统DreamOmni2

香港中文大学、香港科技大学、香港大学与字节跳动联合研发的DreamOmni2系统,标志着AI图像编辑与生成领域的重要突破。该系统通过创新的三阶段数据生成流程和...

盲人复明!马斯克Neuralink联创实现人工视觉里程碑

70岁的She拉·欧文在失明15年后,通过一项名为PRIMA的人工视觉技术重获光明。这项突破性研究由Science Corporation团队主导,其创始人Max Hodak曾是马斯克Neur...

打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

苹果公司在开放研究领域取得突破性进展,发布了Pico-Banana-400K数据集,这是视觉编辑领域首个基于真实图像的大规模开放数据集。该数据集包含40万张图像,通...

清华联手快手可灵,撞车谢赛宁团队RAE,用SVG再证明VAE已过时

AI图像生成技术正在经历一场范式转变,传统的VAE(变分自编码器)技术逐渐被更先进的方案取代。长期以来,扩散模型依赖VAE压缩图像以降低算力成本,但VAE构建...

爆火的AI三宫格图片,比我们的生活更像电影。

最近在社交媒体上,一种由AI生成的三宫格图片迅速走红,成为抖音、小红书等平台的热门内容。这种图片通常由三张具有电影感的画面组成,搭配文艺风格的台词,...
1 2 3 4 5 6 149