视频生成
视频,video
超9000颗星,优于GPT-4V!国内开源多模态大模型
国内开源社区OpenBMB推出了一款新型的多模态大模型——MiniCPM-V 2.6,该模型拥有80亿参数,在图像和视频理解方面表现出色,超越了包括GPT-4V在内的多个知名模...
直播打游戏的马斯克、TED演讲谷歌小姐姐到底是不是真人?网友猜到怀疑人生
AI技术在视频生成领域的快速发展,使得Deep Live Cam这样的直播换脸项目受到广泛关注。该项目通过一张图片即可实现实时直播换脸,不仅在面部表情和动作上与真...
AI 换脸项目 Deep-Live-Cam 一夜爆火:只需一张照片,变身马斯克直播
随着AI换脸技术的快速发展,Deep-Live-Cam项目在GitHub上的火爆引起了广泛关注。该技术能够通过单张照片实现直播流中的实时换脸,效果自然,即使在暗光或点光...
超越恐怖谷!全球500万网友被骗,爆火TEDx演讲者没一个是真人?
最近,一系列看似真实的TED演讲者图片在社交媒体上引起了广泛关注,这些图片实际上是由人工智能生成的。这些图片的逼真程度让网友们惊叹不已,甚至AI识别软件...
直播版Deepfake太恐怖!单张照片实时视频换脸,5分钟安装不挑硬件
Deep-Live-Cam是一个最新的AI换脸项目,能够在实时视频直播中实现换脸效果,仅需一张照片即可完成。该项目一经开源,迅速在GitHub上获得广泛关注,24小时内获...
我用AI鉴宝,在潘家园被店主围攻了!
面壁科技推出的“小钢炮”MiniCPM-V 2.6模型以其出色的视频理解能力受到关注,该模型能够直接部署在iPad上。在潘家园的实地测试中,MiniCPM-V 2.6展现出了对复...
阿里发布轨迹可控的DiT视频生成模型—Tora
视频生成技术在近年来取得了显著进展,特别是在运动控制方面。阿里云提出的基于Diffusion Transformer (DiT) 架构的轨迹可控视频生成模型Tora,通过其创新架...
载入历史,YC新项目屠榜Product Hunt,病毒营销玩出新高度
Wordware,一个集成开发环境(IDE)的应用搭建平台,通过自然语言编程,允许用户构建复杂的人工智能代理(AI Agent)和应用。该平台在Product Hunt上的AI产品...
两篇论文同时获最佳论文荣誉提名,SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
在2024年SIGGRAPH大会上,上海科技大学MARS实验室的团队凭借CLAY和DressCode两篇论文获得了最佳论文荣誉提名,其成果在3D生成领域取得了显著进展。CLAY论文提...
GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉
OpenAI的GPT-4o模型在经过一系列安全测试后,其语音功能因存在潜在风险而迟迟未能上线。该模型在高背景噪声环境下可能模仿用户声音,且在特定提示下可能发出...