图像生成

图像,绘画

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

随着深度学习技术的不断进步,人工智能在图像和视频压缩领域展现出了巨大的潜力。第六届深度学习图像压缩挑战赛(CLIC大赛)的结果显示,火山引擎多媒体实验...

大模型融合!最新「进化算法」全自动组合开源模型,刷榜多项基准测试

Sakana AI团队开发了一种新方法,能够自动组合不同的开源模型,创造出具有新能力的AI系统。这种方法基于集体智慧的概念,即未来的人工智能将不是一个庞大的单...

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

最近,多模态大模型(LMM)在视觉-语言任务上取得了显著的进展,尤其是在视觉场景下的应用。然而,将LMM应用于计算机视觉任务,特别是图像分割方面,仍面临挑...

亚马逊线下店 AI 训练失败:离不开 1000 名审核人员

亚马逊的“拿货即走”技术,一度被视为零售业的一大创新,旨在通过AI视频监控系统实现无需收银员的购物体验。然而,这项技术并未达到预期效果,导致亚马逊不得...

无需训练,这个新方法实现了生成图像尺寸、分辨率自由

近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性能。扩散模型因其卓越...

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

悉尼大学的研究人员在最近的AAAI 2024学术会议上提出了一种名为EdgeNet的新型网络,旨在提高深度神经网络(DNNs)在视觉分类任务中的对抗鲁棒性。EdgeNet是一...

二次元专用超分AI模型APISR:在线可用,入选CVPR

机器之心最近报道了一项关于动漫超分辨率的研究,这项研究由密西根大学、耶鲁大学和浙江大学的联合团队完成,旨在通过人工智能技术提升老动漫的分辨率,以适...

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...

拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了

  文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关注的话题。近期,Meta...
1 88 89 90 91 92 122