图像生成

图像,绘画

Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好

Runway公司以其广受欢迎的视频生成工具而闻名,最近发布了最新版本的Runway Gen-3。Gen-3 Alpha是Runway在全新基础设施上训练出的模型家族的首位成员,与前代...

还得是开源!潞晨Open-Sora技术路线公开,一键生成16秒720p视频,质量更高训练成本更低

潞晨Open-Sora是一个免费开源的高清视频生成工具,自3月份发布以来,受到了广泛关注。它能够生成720p的高清视频,包括人物肖像、科幻大片、动画以及具有流畅...

Runway推出全新超现实AI视频模型Gen-3 Alpha,可生成10秒长视频

Runway公司发布了其最新的AI视频生成模型Gen-3 Alpha,该模型能够根据文本描述和静态图像生成视频内容。与前代模型相比,Gen-3在生成速度、图像质量以及视频...

NVM IP:驾驭先进节点设计的存储利器

当前半导体行业正经历着摩尔定律逐渐逼近极限的挑战,芯片制造业已跨足3纳米节点,正向2纳米迈进。随之而来的是集成度、功耗和性能的极致追求,在此背景下,...

霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+

Hallo是一种基于分层音频驱动视觉合成模块的开源项目,由复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。该项目的主要贡献是提出了一种分...

GPT-4系列模型,在文档理解中的多维度评测

Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...

谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习

在这次深入的讨论中,Aditya Ramesh,OpenAI Sora及DALL·E团队的负责人,以及纽约大学助理教授谢赛宁,共同探讨了人工智能领域中语言和视觉模型的融合及其对...

奥特曼和老黄动手了……Luma干的

Luma AI推出的Dream Machine被誉为“下一代”文生视频工具,发布后引起了广泛关注。然而,实际效果却大大不如预期,导致网友们纷纷吐槽。Dream Machine原本宣传...

AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品

AutoStudio是一种多智能体协同框架,由中山大学和联想团队联合提出,旨在提高AI在多轮交互式图像生成中的性能。该框架无需训练,通过三个基于大型语言模型的...

智源大会最全记录:最重要的AI公司们展开的一场集体辩论

在AI春晚上,众多业界领袖和专家就人工智能领域的多个关键议题展开了深入讨论,涉及大模型的发展趋势、开源与闭源的争议、价格战的影响,以及人工智能通用性...
1 103 104 105 106 107 157