视频生成
视频,video
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还能创作诗歌和配文,显...
靠“一键抠图”拿下数千万美元ARR,估值5亿美元
华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...
Perplexity要搞竞价排名了,大模型的尽头……就还是广告?
Perplexity,一家硅谷的AI明星公司,曾以AI驱动的透明搜索体验挑战谷歌,并获得了7360万美元的融资以及社区的广泛支持。然而,这家一度鄙视广告业务的公司,...
GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动
新智元报道了关于OpenAI即将发布的GPT-5的最新动态。据报道,OpenAI已经向一些用户发送了红队测试的邀请邮件,这表明GPT-5可能已经进入红队测试阶段。红队测...
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
在人工智能领域,模仿人类学习能力一直是研究的热点。近期,由上海人工智能实验室、南京大学、中科院深圳先进技术研究院等机构联合发布的EgoExoLearn数据集,...
免费AI“神器”系列第11弹:苹果版ChatGPT超越GPT-4;腾讯版Sora已获3000星|钛媒体AGI
生成式人工智能(AIGC)领域最近推出了多款新应用,钛媒体AGI整理了五款免费AI“神器”,每款都在其领域内展现了创新和潜力。苹果ReALM:这是一款由苹果研究团...
攻陷短视频后,Sora将需要72万块H100 GPU
文章摘要 【关 键 词】 Sora模型、视频生成、扩散模型、计算成本、推理计算 以下是带有HTML标记的文本,其中重点词语和句子已用HTML元素标记出来...
CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜
FoundationPose模型是一个用于6D物体姿态估计和跟踪的统一大模型,它能够在基于模型和无模型的设置中对新颖物体进行姿态估计和跟踪。该模型通过使用RGBD图像...
AI无人商店背后,是上千个印度人通过摄像头看美国人买西蓝花?
亚马逊的“Just Walk Out”技术是一项旨在简化购物体验的创新,允许顾客在无需排队结账的情况下拿起商品即可离开商店。这项技术通过结合计算机视觉、目标识别、...




