图像生成

图像,绘画

Sora的真实使用体验

Shy Kids团队是一家加拿大制作公司,以其创新的媒体制作方法和探讨现代生活主题的作品而闻名。他们制作了Sora短片《Air Head》,在后期制作中遇到了一些挑战...

清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律

Vidu模型的发布:「Vidu」能够一键生成长达16秒、分辨率达1080p的高清视频内容,其画面效果非常接近Sora,表现出色在多镜头语言、时间和空间一致性、遵循物理...

国产 Sora 的秘密,藏在这个清华系大模型团队中

在视频AIGC(人工智能生成内容)领域,Sora技术因其在长视频生成方面的突破性进展而备受关注。Sora采用的Diffusion加Transformer架构在生成内容的准确性和灵...

一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫

这篇文章介绍了一种虚拟试衣技术,由韩国科学技术院(KAIST)和OMNIOUS.AI共同开发,名为IDM-VTON。该技术利用一种新型扩散模型,能够高度还原服装细节,生成...

西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI

该论文在人工智能顶级期刊IEEE TPAMI上发表,对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理,并对该方向未来的研究重点进行了凝练与总结。视觉问答(V...

端侧模型 OctopusV3 发布:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?

随着人工智能技术的不断进步,我们见证了许多创新的AI模型的诞生。最近,Nexa AI团队推出了一款名为OctopusV3的端侧模型,这款模型被设计为一款手机上的超级...

英伟达加码AI PC!全靠RTX了

在过去的十年中,人工智能(AI)技术已经从理论研究和小规模应用发展成为全球性的技术革命,极大地改变了我们的生活和工作方式。智能手机上的语音助手、复杂...

GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo

SenseChat Lite:轻量级端侧大模型1. 性能对比:在《街头霸王》游戏中,SenseChat Lite与GPT-4进行了一场PK,展示了其快速反应能力。尽管GPT-4还在决策中,Se...

苹果 AI,遥遥落后?

文章分析了苹果公司在人工智能(AI)领域的策略和产品实践,特别是在其智能手机iPhone中的应用。文章指出,尽管苹果在产品中避免使用“AI”这个词,但其实iPhon...

Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率

国产视频生成模型Open-Sora在开源社区中进行了更新,现在支持长达16秒的视频生成,分辨率最高可达720p,并能处理任何宽高比的文本到图像、文本到视频、图像到...
1 81 82 83 84 85 123