图像生成

图像,绘画

何恺明刘壮新作:消除数据集偏差的十年之战

这篇文章介绍了MIT新晋副教授何恺明与刘壮合作完成的研究,针对AI发展中长期存在的数据集偏差问题展开探讨。过去十多年来,尽管业界努力构建更大、更多样化、...

突发!苹果、腾讯同日公布全新大模型研究论文,中美 AI 技术竞争加速|钛媒体AGI

苹果公司近日在人工智能领域迈出重要一步,公布了自家的多模态大模型MM1。这一模型拥有高达300亿的参数规模,在预训练指标中实现SOTA,并具备密集模型和混合...

文本生成4K超高清图像,华为等推出创新模型PixArt-Σ

是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一款文本生成4K超高清图像的模型。与上一代PixArt-α相比,在图像质量、细节、训练效率以及...

苹果终于入局大模型了:300亿参数、MoE 架构,手机要迎来全面的大变革了?

这篇文章介绍了苹果公司在多模态大模型(MLLMs)领域的研究成果,通过一篇名为《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的研...

AI电视,一夜爆发!

以下是根据文章内容撰写的详细、分段的摘要总结,其中重点词语和句子已使用HTML标签进行加粗显示:一、引言1. 从CES、MWC到AWE 2024,科技行业精彩不断。2. A...

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

OpenAI的首席技术官Mira Murati在最近的一次采访中透露了更多关于其新推出的文生视频工具Sora的细节。采访主要围绕以下几个方面展开:Sora的工作原理。作为一...

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...

字节掉队AI时代?

步骤2. 撰写详细摘要:AI技术的快速发展正在重塑各行各业,引发全球科技大厂的竞逐。字节跳动作为互联网'新贵',也在积极布局AI领域。其旗下视频剪辑工具CapCut(...

能说会看会行动,OpenAI机器人,一出手就是王炸

步骤2:Figure,一家明星机器人创业公司,最近发布了全新的机器人demo,这款机器人名为Figure 01,得到了OpenAI大模型的能力加持。Figure 01现在可以与人全面...

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

智东西报道了深度学习领域的一个重要讨论:视频生成器是否可以被视为世界模拟器。Meta首席科学家杨立昆分享了一篇探讨这一问题的万字博文,引发了业界的广泛...
1 98 99 100 101 102 122