图像生成
图像,绘画
二次元专用超分AI模型APISR:在线可用,入选CVPR
机器之心最近报道了一项关于动漫超分辨率的研究,这项研究由密西根大学、耶鲁大学和浙江大学的联合团队完成,旨在通过人工智能技术提升老动漫的分辨率,以适...
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关注的话题。近期,Meta...
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还能创作诗歌和配文,显...
如何用AI画一部武侠漫画?画完后,我沉默了。
在这篇文章中,作者分享了他利用AI技术将自己20年前写的武侠小说制作成漫画的整个过程。这个项目的起源是作者想要在春节假期期间更深入地练习和研究AI技术。...
靠“一键抠图”拿下数千万美元ARR,估值5亿美元
华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...
免费AI“神器”系列第11弹:苹果版ChatGPT超越GPT-4;腾讯版Sora已获3000星|钛媒体AGI
生成式人工智能(AIGC)领域最近推出了多款新应用,钛媒体AGI整理了五款免费AI“神器”,每款都在其领域内展现了创新和潜力。苹果ReALM:这是一款由苹果研究团...
CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜
FoundationPose模型是一个用于6D物体姿态估计和跟踪的统一大模型,它能够在基于模型和无模型的设置中对新颖物体进行姿态估计和跟踪。该模型通过使用RGBD图像...