图像生成
图像,绘画
LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!
新智元报道介绍了微软亚洲研究院推出的基于字节的Transformer模型bGPT,该模型能够处理不同类型的数据,生成文本、图像和音频,甚至模拟计算机行为。bGPT与传...
颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源
该文章介绍了一项名为Masked Diffusion Transformer V2的新技术,该技术在ImageNet基准测试中取得了1.58的FID分数,刷新了最新的SOTA。这项技术通过引入mask ...
对话生数科技CEO唐家渝:数亿元融资背后,中国 AI 视频技术何时超越Sora?|钛媒体AGI
北京生数科技有限公司近日完成数亿元新一轮融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI等跟投。融资将用于多模态基础大模型的迭代研发、应用产品创新...
清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”
生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...
Midjourney能让角色保持一致了!网友连夜实测:改变游戏规则
文章介绍了Midjourney发布的新功能——角色参照,让用户可以生成图像并使其保持与给定参照角色一致的特征。这个功能受到网友们的热烈欢迎,他们纷纷表示这是Mid...
Midjourney控诉Stability AI偷作品还搞崩了服务器!曝光后Stability AI CEO 紧急回应
摘要:生成式AI创业公司Midjourney近期遭遇了24小时的服务器宕机,导致用户图库中的图像无法正确显示。Midjourney认为此次宕机是由于“付费账户的类似僵尸网络...
王室修图何必用PS?Midjourney上新「换脸魔法」,奥特曼一秒COS罗马将军
这篇文章报道了英国王室的P图事件以及AI图片生成技术的发展。文章首先介绍了一张凯特王妃和孩子们的合影引发了修图疑云,甚至有人猜测这张照片可能是由AI生成...
被误解的「中文版Sora」背后,字节跳动有哪些技术?
OpenAI 在 2024 年初发布了一款名为 Sora 的生成式 AI 产品,引发了视频生成领域的广泛关注。Sora 的发布提高了视频生成技术的标准,引发了科技公司之间的竞...
万字梳理:阿里、腾讯等8家中国互联网大厂的50款大模型及应用,能否全面超越GPT-4? | 钛媒体AGI
自OpenAI推出ChatGPT以来,全球科技巨头纷纷加速布局AI大模型领域。钛媒体AGI整理了2023年以来,包括阿里巴巴、百度、字节跳动、腾讯、华为等在内的8家科技公...
字节模型来了!把字节当作token,统一一切,预测一切?
本文介绍了一种名为bGPT(byte GPT,字节GPT)的深度学习模型,它专门用于处理二进制数据和模拟数字世界。bGPT突破了传统语言模型的局限,能够直接理解和操作...