图像生成

图像,绘画

1.2万人朝圣CVPR,华人学者夺最佳论文!Sora舵手火爆演讲成大型追星现场

2024年的CVPR会议在美国西雅图成功举行,成为历史上规模最大、参与人数最多的一届。会议吸引了超过1.2万人参加,共提交了11532篇论文,比去年增加了2000多篇...

超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文

计算机视觉领域的顶级会议CVPR 2024在美国西雅图成功举行,会议规模和参与人数均创历史新高,现场参会人数超过一万两千人。本次会议共接收了11532篇提交论文...

ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据

Epochai发布了一份关于大语言模型(LLM)训练数据消耗的研究报告,指出目前全球公开的高质量文本训练数据集约为300万亿tokens。然而,随着像ChatGPT这样的模...

Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好

Runway公司以其广受欢迎的视频生成工具而闻名,最近发布了最新版本的Runway Gen-3。Gen-3 Alpha是Runway在全新基础设施上训练出的模型家族的首位成员,与前代...

还得是开源!潞晨Open-Sora技术路线公开,一键生成16秒720p视频,质量更高训练成本更低

潞晨Open-Sora是一个免费开源的高清视频生成工具,自3月份发布以来,受到了广泛关注。它能够生成720p的高清视频,包括人物肖像、科幻大片、动画以及具有流畅...

Runway推出全新超现实AI视频模型Gen-3 Alpha,可生成10秒长视频

Runway公司发布了其最新的AI视频生成模型Gen-3 Alpha,该模型能够根据文本描述和静态图像生成视频内容。与前代模型相比,Gen-3在生成速度、图像质量以及视频...

NVM IP:驾驭先进节点设计的存储利器

当前半导体行业正经历着摩尔定律逐渐逼近极限的挑战,芯片制造业已跨足3纳米节点,正向2纳米迈进。随之而来的是集成度、功耗和性能的极致追求,在此背景下,...

霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+

Hallo是一种基于分层音频驱动视觉合成模块的开源项目,由复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。该项目的主要贡献是提出了一种分...

GPT-4系列模型,在文档理解中的多维度评测

Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...

谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习

在这次深入的讨论中,Aditya Ramesh,OpenAI Sora及DALL·E团队的负责人,以及纽约大学助理教授谢赛宁,共同探讨了人工智能领域中语言和视觉模型的融合及其对...
1 80 81 82 83 84 135