图像生成

图像,绘画

字节AI为何凶猛:重启App工厂,争抢“豆包”,连模型也要赛马

2023年8月18日,字节跳动将其AI对话产品Grace更名为“豆包”,这一变化标志着字节跳动在AI领域的战略转型。尽管起步较晚,字节跳动迅速调整战略,由张一鸣提出“...

刚刚,OpenAI发布sCM提升50倍效率,扩散模型重大技术突破!

OpenAI最近发布了一种名为sCM的新型扩散模型方法,该方法在生成高质量图片和3D模型方面表现出色,实现了50倍的时钟加速,尤其在高分辨率任务上效果显著。sCM...

荣耀MagicOS 9.0来了个全局智能体,AI手机方向变了

荣耀公司近期发布了新一代操作系统MagicOS 9.0,标志着智能手机进入了“自动驾驶”时代。这一系统是业内首个搭载智能体的个人化全场景AI操作系统,通过内置的AI...

不怪奥特曼慌!最大对手Anthropic抢先让AI 接管人类电脑,网友怒赞并喊话OpenAI:看看人家

AI初创公司Anthropic推出了一项名为“计算机使用”的新功能,使大型AI模型能够理解并交互桌面应用程序,执行如模拟按键、点击按钮、鼠标手势和输入文本等操作。...

刚刚,Stable Diffusion 3.5重磅开源,文生图模型霸主归来!

Stability AI,一个专注于AIGC领域的专业社区,最近开源了其最新的文生图模型——Stable Diffusion 3.5。该模型包含三个版本:Large、Large Turbo和Medium,旨...

全球首个多模态世界模型Emu3来了!智源王仲远:为多模态大模型训练范式指明新方向|钛媒体AGI

北京智源人工智能研究院(BAAI)近日发布了全球首个原生多模态世界模型Emu3,该模型采用了自回归技术路线,参数量达到8B(80亿),能够将图像、文本和视频编...

骁龙8至尊版登场:CPU牙膏挤爆,AI生成速度创纪录,奥特曼也来助阵

高通在2024骁龙峰会上发布了全新的骁龙8至尊版移动平台,这是一款采用台积电3nm工艺制造的系统级芯片,标志着高通在移动端芯片领域的一次重大突破。该平台集...

预测下个token就能通往AGI,智源Emu3有世界模型的味儿了

智源研究院于2024年10月21日发布了原生多模态世界模型Emu3,这是一个基于下一个token预测的模型,能够处理文本、图像、视频三种模态数据的理解和生成,而无需...

视频、图像、文本,只需基于下一个Token预测:智源Emu3发布,验证多模态模型新范式

智源研究院于2024年10月21日发布了原生多模态世界模型Emu3,这是一个基于下一个token预测的模型,能够在无需扩散模型或组合方法的情况下,完成文本、图像、视...

Ilya观点得证!仅靠预测下一个token统一图像文本视频,智源发布原生多模态世界模型Emu3

智源研究院发布了原生多模态世界模型Emu3,该模型基于下一个token预测,无需依赖扩散模型或组合方法,能够完成文本、图像、视频三种模态数据的理解和生成。Em...
1 76 77 78 79 80 157