图像生成

图像,绘画

7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力

新智元报道了一项关于图推理的研究,该研究由香港科技大学和南方科技大学的研究团队进行。他们证实了视觉图(Visual Graph)在图推理中的作用,并发现它可以...

谢尔盖·布林狠批Gemini「搞砸了」!51岁创始人回归,CEO劈柴或将下台?

摘要:谷歌联合创始人谢尔盖·布林在AGI House举办的Gemini黑客松上公开承认了Gemini在图像生成方面的失误,并表示其回归谷歌是因为AI的快速发展。这一事件引...

谷歌承认了!Gemini 完全搞砸了!

文章主要介绍了谷歌的Gemini AI引擎近期因生成一系列多元化的纳粹图像而引发的公众关注和担忧。谷歌CEO桑达尔·皮查伊对此表示严厉警告,强调这类错误是绝不允...

一张草图直接生成视频游戏,谷歌推出生成交互大模型

本文介绍了谷歌DeepMind推出的首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments(简称“Genie”)。Genie拥有110亿参数,能...

这5家AI初创公司谁最有望成为中国版sora?

摘要总结:在AI视频领域,ChatGPT的成功引发了一场技术竞赛。Sora的AI视频生成技术再次引起全球关注,预示着AI视频模型竞赛的热潮。本文介绍了五家在AI视频领...

电商模特危机!谷歌最新模型Tryon Diffusion一键试衣,线上购物被革命

摘要:谷歌与华盛顿大学联合研发的AI模型TryOnDiffusion,解决了AI换装的两大难题:保留衣服细节和适应不同姿势。用户只需提供自己的全身照和服装模特照片,...

大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景

摘要: 本文介绍了由浙江大学、微软亚洲研究院和北京大学的研究者共同提出的基于文本描述的视频编辑统一框架UniEdit。UniEdit不仅支持传统视频外观编辑,如风...

北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应

北大信息工程学院的袁粒教授和田永鸿教授领衔的团队联合兔展发起了一项名为Open Sora的Sora复现计划。该计划旨在集结开源社区的力量,以有限的资源尽可能完成...

MWC2024,看看厂商的新产品能多离谱!

在巴塞罗那举行的世界移动通信大会(MWC)上,AI和智能手机的结合成为焦点。智能手机制造商强调AI提高了设备安全性、解锁新应用并加快处理速度。CCS Insight...

因为AI,构建「腹部地图」这个医学工作加速了数百倍

人体器官分割技术在医学图像分析中扮演着至关重要的角色,尤其是在自动化疾病诊断和手术治疗方面。传统上,这一过程依赖于放射科医生手动完成,不仅耗时而且...
1 104 105 106 107 108 122